会议专题

互联网络信息安全的监测与过滤技术

本文主要介绍了采用自然语言处理技术和计算机网络技术相结合的方法,针对目前存在的互联网信息污染现状,监测非法网站有害信息,搜寻非法网站网址,记录并分析非法信息内容和语言特征。系统设计采用分布武或多机集群系统,按监管范围进行监管,并分级对待,搜集、分析、自动更新不同级别的网站地址、域名列表。监管模型采用双层分析过滤结构,第一层过滤采用基于规则的正则表达武串匹配算法,用规则的方法排除大多数正常网站。算法采用简单的内容分析技术,追求高处理速度,识别率相对较低。第二层过滤采用基于语义的文本特征向量SVM模型进行文本内容分析技术,算法复杂,速度相对较慢,准确率更高。

互联网 信息安全 信息过滤 过滤技术 文本特征

赵小兵 张普 郝福 秦鹏 张志平

内蒙古呼和浩特市昭乌达路295号内蒙古师范大学信息与工程学院,010020;北京市海淀区学院路15号北京语言大学应用语言学研究所,100080 北京市海淀区学院路15号北京语言大学应用语言学研究所,100080 国家安全生产监督管理总局通信信息中心 内蒙古呼和浩特市昭乌达路295号内蒙古师范大学信息与工程学院,010020

国内会议

第三届HNC与语言学研究学术研讨会

北京

中文

472-480

2005-12-21(万方平台首次上网日期,不代表论文的发表时间)