一种电子邮件敏感信息检测算法
针对目前电子邮件安全网关不能很好地支持敏感信息检测问题,深入研究了Winnow算法和Markov模型,在N-Gram语言模型的基础上,提出了一种邮件特征选择方法--Markov-Gram,该方法以句子为单位进行特征项的选取,不仅保留了更多的语义信息,而且可以有效地减少特征项的数目,解决“维度灾难”问题;提出一种Winnow算法训练过程中初始权重生成方法,该方法融入了电子邮件结构特点以及
信息内容安全 电子邮件过滤 文本分类 Winnow算法 Markov模型
刘子豪 庄毅
南京航空航天大学信息科学与技术学院 南京 210016
国内会议
第八届全国信息隐藏与多媒体安全学术大会暨湖南省计算机学会第十一届学术年会(CIHW 2009)
长沙
中文
323-327
2009-03-01(万方平台首次上网日期,不代表论文的发表时间)