×

动态网页环境下的Web使用记录挖掘研究

消耗积分:2 | 格式:rar | 大小:135 | 2009-09-09

分享资料个

         根据大部分的Web 站点均使用动态网页的实际,提出了并实现了一种在动态网页环境下进行数据采集的方法,使用了新的数据集代替Web 日志作为待挖掘的数据,分析了该数据集的特点,并通过实验说明其可行性。
关键词:Web 使用记录挖掘;动态网页;数据采集
         Web 站点提供和收集了海量的、不断增长的数据和文档,这些数据和文档中蕴含着丰富的信息。
         Web 挖掘是指利用数据挖掘技术从Web 文档和访问数据中发现和抽取知识。有效地利用这些知识,可以对页面内容进行分类、总结和预测趋势,可以改进页面结构,可以获取用户访问模式,对用户进行个性化服务等。Web 挖掘可以有效的利用于搜索引擎、电子商务、网络教育等与Web 相关的应用中。
          Web 挖掘通常可以分为Web 内容挖掘(Content Mining)、Web 结构挖掘(Structure Mining)和Web 使用记录挖掘(Usage Mining)三类[1]。Web 使用记录挖掘是Web 挖掘应用的一个主要方面,是指从用户访问Web 在服务器端留下的访问数据中发现用户的访问模式、兴趣爱好和购买习惯等,用来调整网站结构、提供浏览建议、动态地为用户定制个性化的网站、对用户进行在线推荐等,其挖掘对象主要是服务器日志数据、用户交易信息、用户注册信息等。
         一般将基于 Web 日志的Web 使用记录挖掘称作Web 日志挖掘。大部分Web 日志挖掘算法和实际应用的对象是HTML 静态页面,而现在大部分网站大量使用的是动态页面,这使得分析日志比较困难。为了解决这个问题,本文设计了在动态网页环境下Web 使用记录挖掘的数据采集方法,使用新的数据集代替Web 日志作为待挖掘的数据源。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉

评论(0)
发评论

下载排行榜

全部0条评论

快来发表一下你的评论吧 !