会议专题

基于SMOTE和随机森林的非平衡景点评论分类

针对非平衡网络景点评论的文本情感倾向性分类问题,本文在数据层面上采用了SMOTE算法,使样本数据的分布达到平衡,并分别结合SVM算法和随机森林算法对其进行分类.实验结果表明,SMOTE方法对于不同分类算法在非平衡数据集上的应用是有效的,并且RF+SMOTE的分类效果比SVM+SMOTE的好.

非平衡网络 景点评论 文本分类 情感倾向性 SMOTE算法 随机森林

万斌浩 纪涛 陈美蓉

厦门大学航空航天学院,福建厦门361005

国内会议

全国冶金企业自动化、信息化技术论坛暨全国冶金自动化信息网2016年年会

北京

中文

135-138

2016-06-01(万方平台首次上网日期,不代表论文的发表时间)