×

基于多权重因子的PageRank算法改进_温韬

消耗积分:1 | 格式:pdf | 大小:259KB | 2017-03-08

#Freedom

分享资料个

基于多权重因子的PageRank算法改进_温韬

  Google 将 Web 挖掘技术引入搜索引擎并提出 PageRank 算法,其搜索精度远高于以往的搜索引擎,在商业应用方面获得巨大成功。另一方面,PageRank 算法固有的缺陷日益暴露,许多学者对 PageRank 算法进行了改进, 例如: 针对主题特征无关性问题, Taher Haveliwala 提出一种主题敏感算法;针对忽视域的价值问题 Bharat 提出 HillTop 算法; 针对歧视新网页的问题焦金涛提出了 PRT 算法,该算法加入时间权值,量化标准是 spider 抓取页面时间和网页发布时间的天数差,PRT 得分与时间权值成反比; 张芳提出分析用户行为来关注用户兴趣度, 王德广等人则提出使用 Web 日志文件的 time-taken 字段来量化用户行为。以上改进虽都有效提高了搜索质量, 但焦金涛的改进虽考虑新网页歧视问题,改进算法却未能考虑 spider 的访问周期,张芳的用户行为分析未能够做出具体量化, 王德广等人则只单考虑用户浏览时间因素。本文通过对 PageRank 算法的研究,借鉴前人思想,提出一种结合时间特性、语言结构分析、用户行为分析为一体的 PageRank 改进算法 TWPR。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉

评论(0)
发评论

下载排行榜

全部0条评论

快来发表一下你的评论吧 !