基于集成学习的半监督情感分类方法研究
情感分类旨在对文本所表达的情感色彩类别进行分类的任务。本文研究基于半监督学习的情感分类方法,即在很少规模的标注样本的基础上,借助非标注样本提高情感分类性能。为了提高半监督学习能力,本文提出了一种基于一致性标签的集成方法,用于融合两种主流的情感分类方法:基于随机特征子空间的协同训练方法和标签传播方法。首先使用这两种半监督学习方法训练出的分类器对未标注样本进行标注;然后选取出标注一致的未标注样本;最后使用这些挑选出的样本更新训练模型。实验结果表明,本文的方法能够有效降低对未标注样本的误标注率,从而获得比任一种半监督学习方法更好的分类效果。
高伟 王中卿 李寿山
苏州大学计算机科学与技术学院 自然语言处理实验室 苏州
国内会议
上海
中文
229-236
2012-11-17(万方平台首次上网日期,不代表论文的发表时间)