×

基于超链接和内容相关度的综合爬行策略

消耗积分:2 | 格式:rar | 大小:339 | 2009-08-31

分享资料个

介绍了网页分析算法HITS 算法,并对HITS 算法进行改进,提出了一种基于超链接和内容相关度的网页排序算法VHITS 算法。VHITS 算法引入向量空间模型计算网页内容的主题相关度,并用来评价超链接的重要性,从而避免了HITS 算法所产生的主题漂移现象,有效的引导主题挖掘。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉

评论(0)
发评论

下载排行榜

全部0条评论

快来发表一下你的评论吧 !