×

相似度技术在资料信息化中的应用研究

消耗积分:0 | 格式:pdf | 大小:653 KB | 2013-03-01

徐锋

分享资料个

讨论了目前常用的相似度度量技术:属性计数技术和结构度量技术,通过字符串匹配算法对得到的标记字符串作比较,并根据比较结果给出它们之间匹配程度的数值表示,以此作为文件相似度的度量值。该值越大说明文件越相似,资料信息化过程中存在拷贝的可能性也越高。验证结果表明,该实验系统能检测到资料录入数据中大部分的相似内容。


声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉

评论(0)
发评论

下载排行榜

全部0条评论

快来发表一下你的评论吧 !