会议专题

采集Ajax网页信息的网络爬虫研究与实现

  通过使用浏览器API并模拟用户行为对网页元素进行操作采集Ajax网页信息。基于同一站点同一类型Ajax网页结构相似性特点,在系统采集动态信息前增加预处理阶段,查找Ajax网页中的有效触发元素,并对有效触发元素进行规约和模式分类,制定采集规则,实现Ajax网页信息的快速采集。

Ajax网页 信息采集 网络爬虫 有效触发元素

王佳 魏慧琴

北京交通大学计算机与信息技术学院 北京 100044

国内会议

中国计算机用户协会网络应用分会2011年第十五届网络新技术与应用年会

北京

中文

196-198

2011-10-30(万方平台首次上网日期,不代表论文的发表时间)