采集Ajax网页信息的网络爬虫研究与实现
通过使用浏览器API并模拟用户行为对网页元素进行操作采集Ajax网页信息。基于同一站点同一类型Ajax网页结构相似性特点,在系统采集动态信息前增加预处理阶段,查找Ajax网页中的有效触发元素,并对有效触发元素进行规约和模式分类,制定采集规则,实现Ajax网页信息的快速采集。
Ajax网页 信息采集 网络爬虫 有效触发元素
王佳 魏慧琴
北京交通大学计算机与信息技术学院 北京 100044
国内会议
中国计算机用户协会网络应用分会2011年第十五届网络新技术与应用年会
北京
中文
196-198
2011-10-30(万方平台首次上网日期,不代表论文的发表时间)