针对现有句子相似度算法无法处理同义词、准确率低和复杂度高等不足,结合词向量技术改进 Levenshtein相似度算法和 Jaccard系数,提出一种新的句子相似度算法用于释义识别,并对多种句子相似度算法的优劣进行分析,设计多相似度特征组合的应用模式。基于MRPC释义识别数据集的实验结果表明,使用该算法的释义识别模型准确率与F值分别达到74.4%和83.1%,与使用TF:IDF算法、词袋算法等传统算法的模型相比识别性能更优。
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
全部0条评论
快来发表一下你的评论吧 !