基于AdaBoost的微博垃圾评论识别方法
针对微博上存在的大量垃圾评论,提出一种基于AdaBoost的微博垃圾评论识别方法.该方法首先提取表示微博评论的特征值向量,由8个特征值组成,然后通过AdaBoost算法在这些特征上训练出若干个比随机预测好的弱分类器,最后将得到的弱分类器加权集合成高精度的强分类器.从实际的热门新浪微博中提取评论数据集进行实验,结果表明所选取的8个特征是有效的,该方法对于微博垃圾评论的识别拥有较高的识别率.
微博垃圾评论 迭代算法 特征值向量 数据挖掘
黄铃 李学明
重庆大学 计算机学院,重庆 400044
国内会议
昆明
中文
3563-3566
2013-08-16(万方平台首次上网日期,不代表论文的发表时间)