基于流形学习的半监督文本情感分类算法
情感分类是一项具有较大实用价值的分类技术,它能够识别文本内容中隐含的情感或观点,在互联网信息日益丰富的今天,情感分类可以在一定程度上解决信息杂乱的情况,方便用户准确获取所需信息.然而,由于数据的标注耗时耗力,情感分类面临着只有极少标注数据和大量的无标注数据的问题.本文提出了一种新颖的基于线性邻域扩散的半监督学习的文本情感分类算法.假设空间中存在一个情感流形结构,待分类文本看做是这个流形上抽样的点,首先,利用这些点的邻域信息进行构图,每个点与它近邻的边的权重使用它的近邻线性加权表示;然后,将该图看做是一个概率转移矩阵,各类别的标签在此矩阵上扩散完成分类过程.实验结果表明,该算法在文本情感分类上具有良好的性能.
流形学习 情感分类 半监督学习 线性邻域扩散
何慧 陈博 郭军
华北电力大学 计算机系,北京市 102206 NEC研究院,北京市 北京邮电大学 信息与通信工程学院,北京市 100876
国内会议
上海
中文
480-487
2009-11-14(万方平台首次上网日期,不代表论文的发表时间)