互联网敏感信息快速识别技术
互联网敏感信息的识别过滤对促进互联网健康发展有重要意义。为逃避计算机的识别,敏感信息往往以变形形式出现,使得敏感信息的识别变得困难。针对这一问题,本文提出了一种多模式模糊匹配的敏感规则过滤算法。通过对用户自定义的关键词进行拆分,并利用拼音编码为关键词建立索引表,实现同音变形的匹配。同时,通过引入逻辑表达式作为过滤规则,增强了表达描述敏感信息的能力。实验证明,算法有良好的识别效果和运行效率。
互联网 敏感信息 模糊匹配 识别技术
王晨峰 宗良 黄小江 杨建武
北京大学计算机科学技术研究所
国内会议
深圳
中文
659-665
2008-11-27(万方平台首次上网日期,不代表论文的发表时间)