结合文档本身的结构信息与外部词语的语义信息,提出一种融合BERT词向量与 Textrank的关键词抽取方法。在基于网络图的 Textrank方法基础上,引入语义差异性并利用BERT词向量加权方式优化 Textrank转移概率矩阵计算过程,同时通过迭代运算对文档中的词语进行综合影响力得分排序,最终提取得分最高的TopN个词语作为关键词。实验结果表明,当选取Top3、Top5、Top7和Topl0个关键词时,与基于词向量聚类质心与 Textrank加权的关键词抽取方法相比,该方法的平均F值提升了2.5%,关键词抽取效率更高。
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
全部0条评论
快来发表一下你的评论吧 !