基于特征域词频的邮件过滤方法的研究
提出了根据邮件特征域信息和特征词频进行垃圾邮件过滤的新方法,并介绍在该方法中的文本特征选取、特征词典构造以及基于TF的权值计算等相关技术,以及改进的文本相似度计算概率模型.实验表明该方法在邮件过滤的查全率、查准率等几个性能评价指标上,比传统的Rocchio方法有了明显改善.
垃圾邮件过滤 特征域 特征词典 词频 权值计算
刘慧 马军 雷景生 连莉
山东经济学院,计算机科学与技术学院,山东,济南,250014;山东大学,计算机科学与技术学院,山东,济南,250061 山东大学,计算机科学与技术学院,山东,济南,250061 山东大学,计算机科学与技术学院,山东,济南,250061;海南大学,信息技术学院,海南,海口,570228
国内会议
第四届全国搜索引擎和网上信息挖掘学术研讨会(SEWM2006)
济南
中文
50-53,57
2006-07-21(万方平台首次上网日期,不代表论文的发表时间)