会议专题

基于特征域词频的邮件过滤方法的研究

提出了根据邮件特征域信息和特征词频进行垃圾邮件过滤的新方法,并介绍在该方法中的文本特征选取、特征词典构造以及基于TF的权值计算等相关技术,以及改进的文本相似度计算概率模型.实验表明该方法在邮件过滤的查全率、查准率等几个性能评价指标上,比传统的Rocchio方法有了明显改善.

垃圾邮件过滤 特征域 特征词典 词频 权值计算

刘慧 马军 雷景生 连莉

山东经济学院,计算机科学与技术学院,山东,济南,250014;山东大学,计算机科学与技术学院,山东,济南,250061 山东大学,计算机科学与技术学院,山东,济南,250061 山东大学,计算机科学与技术学院,山东,济南,250061;海南大学,信息技术学院,海南,海口,570228

国内会议

第四届全国搜索引擎和网上信息挖掘学术研讨会(SEWM2006)

济南

中文

50-53,57

2006-07-21(万方平台首次上网日期,不代表论文的发表时间)