会议专题

一种基于特征簇的微博短文本情感分类方法

针对由微博短文本特征规模大、自身特征较少等特点导致的数据稀疏性,提出一种基于特征簇的微博情感分类方法.提出的分类方法以大规模语料库为基础,利用word2vec模型学习词语之间潜在的语义关联,将单个词语表示成多维向量的形式;结合情感词典,提取出微博文本的情感特征集,在基于词向量计算词语相似度方法的基础上,将情感特征合并为特征簇,以此构造低维的文本向量;最后利用机器学习算法,构建情感分类器,实现微博短文本的情感分类.实验结果表明,本文提出的方法对情感特征的降维是可行和有效的,并且取得很好的情感分类效果.

文本处理 情感分类 机器学习 情感词典

周咏梅 王伟 阳爱民 林江豪 方泽锋

广东外语外贸大学思科信息学院,广东 广州510006;广东外语外贸大学语言工程与计算实验室,广东 广州510006 广东外语外贸大学思科信息学院,广东 广州510006 广东外语外贸大学财务处,广东 广州510420

国内会议

中国中文信息学会2015学术年会(CIPS2015)暨第十四届全国计算语言学学术会议(CCL2015)、第三届基于自然标注大数据的自然语言处理国际学术研讨会(NLP-NABD2015)

广州

中文

1-9

2015-11-13(万方平台首次上网日期,不代表论文的发表时间)