会议专题

不平衡情感分类中的特征选择方法研究

随着网络的发展,情感分类任务受到广大研究人员的密切关注。针对情感分类中的不平衡数据分布和高维特征问题,本文比较研究了四种经典的特征选择方法在不平衡情感分类中的应用。同时,本文提出了三种不同的特征选择模式并实验比较了这三种模式在分类和降维性能方面的表现。实验结果表明在不平衡数据的情感分类任务中,特征选择方法能够在不损失分类效果的前提下显著降低特征向量的维度。此外,特征选择方法中信息增益(IG)结合“先随机欠采样后特征选择”模式能够取得最佳的分类效果。

王志昊 王中卿 李寿山 李培峰

自然语言处理实验室 苏州大学计算机科学与技术学院

国内会议

第六届全国青年计算语言学会议

上海

中文

243-249

2012-11-17(万方平台首次上网日期,不代表论文的发表时间)