互联网敏感信息快速识别技术

摘要：

　　互联网敏感信息的识别过滤对促进互联网健康发展有重要意义。为逃避计算机的识别，敏感信息往往以变形形式出现，使得敏感信息的识别变得困难。针对这一问题，本文提出了一种多模式模糊匹配的敏感规则过滤算法。通过对用户自定义的关键词进行拆分，并利用拼音编码为关键词建立索引表，实现同音变形的匹配。同时，通过引入逻辑表达式作为过滤规则，增强了表达描述敏感信息的能力。实验证明，算法有良好的识别效果和运行效率。

关键词：互联网敏感信息模糊匹配识别技术

作者: 王晨峰宗良黄小江杨建武

作者单位: 北京大学计算机科学技术研究所

会议类型: 国内会议

会议名称: 2008年互联网新媒体新技术研讨会

会议地点: 深圳

会议语种:中文

页码: 659-665

在线出版日期: 2008-11-27（万方平台首次上网日期，不代表论文的发表时间）

会议专题

互联网敏感信息快速识别技术