×

基于Web日志仿真生成WLSG算法

消耗积分:1 | 格式:rar | 大小:0.84 MB | 2017-12-08

分享资料个

  大数据规模的激增,给数据处理的服务平台带来不可预知的后果。对Web服务日志的分析,不仅能够帮助服务平台有效预防网络异常的产生,也能对服务平台进行压力测试分析,有利于提升服务平台的可靠性。然而Web日志中包含用户隐私信息,企业及政府等机构极少愿意公开日志供研究人员使用;同时,现已公开的Web日志数据年代久远,其特征不符合当前大数据时代特征H1。如何仿真生成逼真的Web日志,是学术界的热点问题,也是本文研究的方向。以中国科学院的可伸缩大数据生成组件(Scalable Big Data Cenerator Suite.BDCS)为代表的Web日志生成器不仅能够用于Web服务器压力测试和性能研究,而且具有很高的扩展性。但有一个显著的缺点是:Web日志的时间依赖性表达能力很弱;以动态Web代理缓存负载生成器(Proxy Workload Generator.ProWGen)为代表的日志生成器能较好地以时间局部性拟合Web文件特征,却是采用静态分布模型。当前随着应用需求的日益扩大,要求生成器的仿真性能较高,这给Web日志生成方法带来了严重的挑战。事实上,当出现热点时,数据会表现为突发性地围绕热点动态变化。但当前已有的Web日志生成器主要是基于静态数据分布设计的,忽略了分布的动态性和用户行为的复杂性,虽然引入了Web文件的时间局部性,却没有站在时间角度来衡量Web文件的时间局部性。

  针对此问题,本文提出一种动态仿真模型——基于用户兴趣迁移的Web日志仿真生成(Web Log Simulation Ceneration based on user interest migration, WLSG)算法。该WLSC算法对用户属性、Web文件属性分别和时间的依赖关系进行建模,也融入了用户兴趣迁移以及自适应访问兴趣度高的Web文件,能够生成具有强的时间依赖性,用户访问顺序可调,且包含用户的个性化特征的逼真日志数据。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉

评论(0)
发评论

下载排行榜

全部0条评论

快来发表一下你的评论吧 !