×

面向微博热点话题的改进BBTM模型

消耗积分:0 | 格式:pdf | 大小:4.90 MB | 2021-06-09

分享资料个

  针对目前基于主题模型的微博短文本热点话题发现存在特征稀疏、高维度以及需要人工指定主题数目等问题,提出一种基于改进突发词对主题模型( bursty biterm topic model,BBTM)的热点话题发现方法( hot topic- hot biterm topic model, H-HBTM)。首先,利用词的突发概率进行特征选择,过滤非突发词。其次结合微博文本的突发特性和传播特性计算微博词对的热值突发概率,将热值突发概率作为BBIM的先验概率。最后,利用基于密度的方法自适应选择BBIM的最优话题数目,确定最优BBTM,实现热点话题发现。在真实微博数据集上的实验表明,H-HBIM可以在不需要预先设定主题数目的情况下,自动发现最优话题模型并且H-HBTM发现的热点话题的质量高于基于BBTM、词对主题模型以及潜在狄立克雷分配的方法。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉

评论(0)
发评论

下载排行榜

全部0条评论

快来发表一下你的评论吧 !