×

一种基于P2P网络的分布式PageRank算法

消耗积分:3 | 格式:rar | 大小:201 | 2009-08-18

笑过就走

分享资料个

随着网页数量的快速增长,集中式的网络搜索引擎已经不能在性能上满足需求。为此
提出了一种新的基于P2P网络的分布式PageRank算法。该算法引入了间接消息发送机制来降低存在于各个网络结点之间的网络拥塞。同时讨论了该算法的收敛时间和带宽消耗。实验证明该算法提供了新的方式能在提高精确度的基础上降低通信量。
传统的PageRank是一种建立在所有网页链接拓扑图上的、集中式的计算技术。通过离线
计算整个网络的PageRank值,在用户查询时根据关键字匹配获得网页集合。随着网页数量的快速增长,集中式的网络搜索引擎已经不能在性能上满足需求。PageRank只有采用分布式的算法,才能和目前的网络搜索引擎结构相结合,并在性能上满足快速更新的要求。
由于PageRank是一种同步迭代算法,下一步的计算要依赖于前几步计算产生的值做为基
础。采用分布式计算时,整个网络拓扑图被划分成若干部分,计算时必然造成各个部分之间的链接失效。这种情况是导致分布式PageRank计算产生误差的主要原因。随之产生的页面划分与消息拥塞必须予以重要考虑。
P2P 网络技术由于其自组织性,健壮性以及分布式计算而得以广泛流行。所有网络节点
上的设备都可以建立P2P对话[1]。本文提出了一种基于上述网络平台的分布式PageRank算法,讨论了该算法的收敛时间和带宽消耗。同时引入间接消息机制来降低通信量。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉

评论(0)
发评论

下载排行榜

全部0条评论

快来发表一下你的评论吧 !