文本自动摘要是获取微博重要信息的一种手段,但微博的短文本、高冗余、高噪声等特征对于自动摘要造成较大的影响。为此,提出一种基于个人微博内容与相关性的事件摘要提取算法CRPageRank。将微博事件集构建成事件图,结合微博内容质量,利用CRPageRank算法计算出微博的总权重,选取有代表性的微博生成初始摘要进行可读性加工,使摘要更具可读性。实验结果表明,该算法相对于TextRank算法和LexRank算法,准确率和召回率明显提高,而且生成的摘要内容简洁,信息全面,阅读性好。
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
全部0条评论
快来发表一下你的评论吧 !