会议专题

一种基于爬虫的BBS数据获取与分析框架设计

近年来网络安全问题日益严重,针对BBS数据的安全监管成为一个重要的应用需求。而获取BBS上的各种数据并加以过滤、分析则是BBS数据监管关键技术。针对这一问题,提出了一种基于爬虫的BBS数据获取与分析框架,并设计实现了一个系统原型。实验系统能够有效地获取BBS上的数据内容,并根据要求进行分类,把获得的数据存储在数据库中为其他应用提供数据。实验结果表明本文提出的框架可行、有效。

电子公告板系统 数据获取 网络爬虫 框架设计

苏利敏 杨延嵩 薛永毅

北京联合大学信息学院 北京 100101

国内会议

中国计算机用户协会网络应用分会2008年网络新技术与应用研讨会

青岛

中文

108-110

2008-10-01(万方平台首次上网日期,不代表论文的发表时间)