采集Ajax网页信息的网络爬虫研究与实现

摘要：

　　通过使用浏览器API并模拟用户行为对网页元素进行操作采集Ajax网页信息。基于同一站点同一类型Ajax网页结构相似性特点，在系统采集动态信息前增加预处理阶段，查找Ajax网页中的有效触发元素，并对有效触发元素进行规约和模式分类，制定采集规则，实现Ajax网页信息的快速采集。

关键词： Ajax网页信息采集网络爬虫有效触发元素

作者: 王佳魏慧琴

作者单位: 北京交通大学计算机与信息技术学院北京 100044

会议类型: 国内会议

会议地点: 北京

会议语种:中文

页码: 196-198

在线出版日期: 2011-10-30（万方平台首次上网日期，不代表论文的发表时间）

会议专题