SpamAssassin中文规则研究及实践

摘要：

SpamAssassin是垃圾邮件过滤技术最为典型而广泛的应用平台,它通过邮件特征信息分析和基于规则的过滤方法消灭垃圾邮件。利用SpamAssassin过滤中文垃圾邮件时,过滤效果依赖于中文规则的数目以及过滤规则的有效程度。SpamAssassin的中文规则少而且规则的形式和权重值都亟待于合理的设置和调整。本文采用统计和遗传算法设计并实现中文规则生成及规则权重值训练,通过CCERT(中国教育和科研计算机网紧急响应小组)提供的真实邮件信息进行过滤实验,验证并生成高效的SpamAssassin中文规则。

关键词：垃圾邮件过滤实验中文规则权重值遗传算法

作者: 孙东红陈光英刘勇段海新

作者单位: 清华大学信息网络工程研究中心,北京 100086 国家计算机网络应急技术处理协调中心,北京 100029

会议类型: 国内会议

会议名称: 2007年全国网络与信息安全技术研讨会

会议地点: 青岛

会议语种:中文

页码: 558-562

在线出版日期: 2007-07-18（万方平台首次上网日期，不代表论文的发表时间）

会议专题

SpamAssassin中文规则研究及实践