会议专题

基于机器学习的批量网页篡改检测方法

针对网页篡改问题,设计了一种基于机器学习的批量网页篡改检测方法.以一所综合性大学所有注册网站为研究对象,通过抓取网站首页面的所有信息,对抓取数据进行分类建立对应的检测规则,综合判断网页是否存在篡改.该方法分为学习阶段和检测阶段,学习阶段根据网页历史信息获取各个检测器的标准值,检测阶段对待检测网页的各个参数进行检测,综合多个检测器的输出,反馈检测结果,若结果为误报,则系统进行重新训练修正参数.以实际发生的网页篡改案例为依据,进行网页篡改模拟,并对误报率和漏报率进行了分析,结果表明:当检测数据集窗口大小为11,报警阈值为2时,误报率为1.183%,漏报率为0.878%,获得了最优的效果.

网络安全 篡改检测 误报率 漏报率 机器学习

赖清楠 陈诗洋 马皓 张蓓

北京大学计算中心,北京100871 北京大学信息科学技术学院,北京100871

国内会议

中国教育和科研计算机网CERNET第二十三届学术年会

重庆

中文

16-20

2016-10-24(万方平台首次上网日期,不代表论文的发表时间)