一种基于优化算法改进的垃圾邮件样本特征选择机制
垃圾邮件过滤的研究需要对邮件样本进行特征选择,为满足“选出更少的特征来更准确识别绝人部分垃圾邮件的过滤需求”,本文提出了一种基于优化算法改进的垃圾邮件样本特征选择机制。该机制使用被选中的特征子集训练朴素贝叶斯分类器,进行测试得到其漏判率,使用漏判率作为优化算法的评价函数,对可能的特征子集进行基于优化算法的搜索,得到较优的特征子集,最后输出该特征子集处理后形成垃圾邮件过滤用规则。本文分别采用遗传算法和粒子群优化算法对特征选择机制进行了改进。实验结果证明了本文所设计的机制是有效的。
垃圾邮件样本 特征选择 遗传算法 粒子群优化算法
张登科 王兴伟 易秀双
东北大学 网络中心,辽宁 沈阳 1108199
国内会议
秦皇岛
中文
391-394
2010-09-16(万方平台首次上网日期,不代表论文的发表时间)