会议专题

基于用户行为的色情网站识别

本文从分析海量互联网用户访问日志入手,通过分析用户访问色情网站与普通网站时产生的不同行为,尝试发现色情网站与普通网站的一些不同的行为模式,并从这些不同中提取出特征,结合机器学习方法,完成基于用户行为这些特征对网站的分类。实验表明,该方法可以较准确、高效的从网站中识别色情网站。

色情网站 色情词 用户行为

曹建勋 刘奕群 岑荣伟 马少平 茹立云

智能技术与系统国家重点实验室,清华信息科学与技术国家实验室(筹),清华大学计算机系,北京,100084

国内会议

第六届全国信息检索学术会议

黑龙江镜泊湖

中文

199-206

2010-08-12(万方平台首次上网日期,不代表论文的发表时间)