基于SMOTE和随机森林的非平衡景点评论分类
针对非平衡网络景点评论的文本情感倾向性分类问题,本文在数据层面上采用了SMOTE算法,使样本数据的分布达到平衡,并分别结合SVM算法和随机森林算法对其进行分类.实验结果表明,SMOTE方法对于不同分类算法在非平衡数据集上的应用是有效的,并且RF+SMOTE的分类效果比SVM+SMOTE的好.
非平衡网络 景点评论 文本分类 情感倾向性 SMOTE算法 随机森林
万斌浩 纪涛 陈美蓉
厦门大学航空航天学院,福建厦门361005
国内会议
全国冶金企业自动化、信息化技术论坛暨全国冶金自动化信息网2016年年会
北京
中文
135-138
2016-06-01(万方平台首次上网日期,不代表论文的发表时间)