SpamAssassin中文规则研究及实践
SpamAssassin是垃圾邮件过滤技术最为典型而广泛的应用平台,它通过邮件特征信息分析和基于规则的过滤方法消灭垃圾邮件。利用SpamAssassin过滤中文垃圾邮件时,过滤效果依赖于中文规则的数目以及过滤规则的有效程度。SpamAssassin的中文规则少而且规则的形式和权重值都亟待于合理的设置和调整。本文采用统计和遗传算法设计并实现中文规则生成及规则权重值训练,通过CCERT(中国教育和科研计算机网紧急响应小组)提供的真实邮件信息进行过滤实验,验证并生成高效的SpamAssassin中文规则。
垃圾邮件 过滤实验 中文规则 权重值 遗传算法
孙东红 陈光英 刘勇 段海新
清华大学信息网络工程研究中心,北京 100086 国家计算机网络应急技术处理协调中心,北京 100029
国内会议
青岛
中文
558-562
2007-07-18(万方平台首次上网日期,不代表论文的发表时间)