基于主题聚类的情感极性判别方法
目前,大多数方法在判别文本情感极性上采用的是提取情感特征并应用分类器进行分类的方式.然而由于网络文本表述方式多样、主题分散等特点,使得情感特征提取过程变得愈发困难.本文借助LDA主题模型首先对文本进行主题聚类,然后在每个主题子类上应用循环神经网络的方法对正、负情感样本分别建立主题模型,最后通过所属主题和所属情感的概率进行联合判断.通过这种方法,首先通过划分子类的方式规整了不同主题下文本的表述方式,限制了不同主题下词汇词义改变的问题,其次利用训练语言模型的方法很好地规避了直接提取特征的困难,将特征的挖掘过程内化在了训练模型的过程中.通过在IMDB电影评论样本上的实验,可以看出,在应用了主题聚类后,模型分类的准确性有了显著地提高.
情感极性判别 特征提取 分类器 主题聚类
李天辰 殷建平
国防科学技术大学计算机学院,湖南省长沙市 410073 国防科学技术大学高性能计算重点实验室,湖南省长沙市 410073
国内会议
金华
中文
1-6
2015-10-30(万方平台首次上网日期,不代表论文的发表时间)