会议专题

基于情感特征向量的Twitter情感分类方法研究

公众情感在包括电影评论、消费者信心、政治选举、股票走势预测等众多领域发挥着越来越大的影响力.面向公共媒体内容开展情感分析是分析公众情感的一项基础工作.经典的基于词频特征向量的特征提取方法,主要利用词频作为文本分类的依据,而词频与情感信息之间的关系并不紧密.针对Twitter推文的特点,本文提出了一种采用基于情感特征向量的Twitter推文情感分类方法.该方法首先通过对推文进行数据清洗、词形还原、词性标注和词汇向量化;其次,将单词匹配到情感词典中;最后,利用每个单词的正向情感、负向情感取值生成情感特征向量,通过MNB、SVM等机器学习方法训练模型,对推文的情感进行分类.实验结果表明采用情感特征向量的Twitter推文情感分类方法能够获得更佳的分类性能.

文本处理 情感分类 情感特征向量

易顺明 易昊 周国栋

沙洲职业工学院电子信息工程系,江苏 苏州215600 美国Rutgers大学数学系,美国 新泽西 苏州大学计算机科学与技术学院,江苏 苏州215006

国内会议

中国中文信息学会2015学术年会(CIPS2015)暨第十四届全国计算语言学学术会议(CCL2015)、第三届基于自然标注大数据的自然语言处理国际学术研讨会(NLP-NABD2015)

广州

中文

1-9

2015-11-13(万方平台首次上网日期,不代表论文的发表时间)