×

Kaggle网站流量预测模型

消耗积分:2 | 格式:zip | 大小:0.90 MB | 2022-04-27

分享资料个

授权协议 未知
开发语言 Python
操作系统 跨平台
软件类型 开源软件

软件简介

Kaggle 是一个网站流量预测项目,项目采用Python语言开发,可以给大家的流量预测建模提供一些思路。

数据模型

Kaggle的训练数据集由大约14.5万套时间序列组成,每一套时间序列代表的是每天不同维基百科文章页的浏览次数,时间记录的周期为2015年7月1日到2017年9月10日。而我们的目标是为了预测2017年9月13日到2017年11月13日之间每天的页面浏览量。其中,需要检测的流量包括移动端、桌面端以及爬虫流量。

注:模型的评价指标为SMAPE。

测评方法

使用了一个单一的神经网络来对14.5万套时间序列进行建模,该模型架构跟WaveNet非常相似,主要由扩展卷积和因果卷积网络组成,整个概念如下图所示:

poYBAGJiZTOAM4jKAE-FCqGBjUI394.jpg

为了让数据模型适应并生成整个64天的相干预测值,我们还需要对模型进行一些修改。为了在条件信息不足的情况下尽量减少错误序列信息的生成,我们采用了一种“序列-序列”的方法,其中的编码器和解码器不会共享参数。这样一来,我们就可以在模型生成长序列的情况下让解码器来负责处理积累的噪声了。

下面给出的是一些样本预测,并演示了一些可以捕捉和预测的网络模型。其中,预测值为黄色,灰色的是真实数据值,Y轴为对数变换:

pYYBAGJiZTWASjBEAAIbBhn-ejw934.jpg

pYYBAGJiZTaAF_aIAADryO6R9Ww034.jpg

配置要求

12 GBGPU(建议)+Python2.7

Python数据包:

numpy==1.13.1

pandas==0.19.2

scikit-learn==0.18.1

tensorflow==1.3.0 

介绍内容来自 FreeBuf

 

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉

评论(0)
发评论

下载排行榜

全部0条评论

快来发表一下你的评论吧 !