基于分割和分类联合模型的中文微博情感分析
研究微博情感分析具有重要的理论意义和现实价值.当前的中文情感分析研究性能较差,主要原因是已有的算法采用串行的模式对其进行研究,即先分词,然后根据分词的结果采取特征建模,进而来训练分类器.串行模式的缺点是分词的错误会进行传播,从而影响分类器的性能.本文提出一种创新的基于分割和分类的联合模型来实现中文微博情感分析.首先根据候选生成模型为句子生成多个候选,基于候选排序模型对该句子进行打分,选择分数最高的前K个候选,放入情感分类模型里面来训练分类器.根据分类器的性能高低来调整候选排序模型的参数权重.以此来进行迭代,直到算法收敛.本文所提算法不仅能修正一部分分词结果,而且可以生成一些情感描述短语,使得情感分析的性能获得提升.在NLP&CC2013中文微博数据集上的实验证实了本文所提算法的有效性.
中文文本 情感分析 候选生成模型 候选排序模型
陈波 姬东鸿 吕晨 柏云深 魏小梅
湖北文理学院文学院,湖北襄阳441053;武汉大学计算机学院,湖北武汉430072 武汉大学计算机学院,湖北武汉430072
国内会议
中国中文信息学会2015学术年会(CIPS2015)暨第十四届全国计算语言学学术会议(CCL2015)、第三届基于自然标注大数据的自然语言处理国际学术研讨会(NLP-NABD2015)
广州
中文
1-11
2015-11-13(万方平台首次上网日期,不代表论文的发表时间)