×

如何使用词典和弱标注信息进行电影的评论情感分析

消耗积分:0 | 格式:rar | 大小:0.78 MB | 2018-11-27

分享资料个

  针对评论文 本情感分析研究中数据标注费时费力的问题,提出了一种新的数据自动标注方法。首先,通过基于情感词典的方法计算出评论文本的情感倾向;其次,利用用户评分的弱标注信息和基于词典方法的情感倾向对评论文本自动标注;最后,利用支持向量机(SVM)对评论文本进行情感分类。所提出的数据自动标注方法在两种类型数据集情感分类准确率上分别达到了77.2%和77. 8% ,相对于单一的利用用户评分对数据标注的方法,分别提高了1.7个百分点和2.1个百分点。实验结果表明,提出的数据自动标注方法在电影评论情感分析中能提高分类效果。

  目前情感分析研究技术主要分为基于情感词典的方法和基于机器学习的方法

  基于情感词典的研究方法主要是根据情感词库来匹配计算评论的情感倾向。Liu 等在的基础上考虑了主题词与情感词之间的距离对评论情感倾向的影响,距离越远影响越弱。基于词典的方法没有办法识别文本中隐含的观点,Zhang等认为基于词典的方法只能通过显式的情感词提取观点。此外,本文还常常出现上下半句情感倾向出现转折同一情感词在不同环境下极性不一-样 的情况。
 

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉

评论(0)
发评论

下载排行榜

全部0条评论

快来发表一下你的评论吧 !