隐私保护的自适应垃圾邮件过滤方法研究
在文本信息处理领域,随着信息网络化的发展使得获取海量的文本训练集不再困难。但在合理利用这些文本训练集进行数据挖掘的同时,必然遭遇到隐私保护方面的诸多问题,特别是针对涉及用户隐私的文本数据所进行的挖掘。针对垃圾邮件过滤中隐私保护问题进行了研究,在给出了基于隐私保护的自适应垃圾邮件过滤模型的基础上,讨论了一种基于简单散列变化的隐私数据保护方法,并给出了一种改进的数据部分属性隐藏的隐私数据保护方法。分析和实验结果表明,改进方法能够有效地解决在线自适应垃圾邮件过滤中隐私保护的问题。
隐私保护 数据挖掘 垃圾邮件 过滤方法
杨震 范科峰 雷建军
北京工业大学 计算机学院,北京 100124 北京邮电大学 网络与交换国家重点实验室信息安全中心,北京 100876 天津大学 电子信息工程学院,天津 300072
国内会议
天津
中文
145-149
2009-10-01(万方平台首次上网日期,不代表论文的发表时间)