crlib:可交互异构Crawler框架的设计与实现
为了简化Crawler的开发流程及更新代价,本文提出Crawler的通用内核crlib,crlib抽象出Crawler的基本功能,以动态库的形式嵌入具体Crawler实例当中.crlib不仅提供了可定制的应用接口,还提供了可交互式的对Crawler工作流程进行控制的消息接口,该接口标准化了Crawler各组件之间的通信机制.
计算机网络 信息采集 通信接口
刘宝良 李建中
哈尔滨工业大学计算机学院数据库技术研究中心(哈尔滨)
国内会议
长沙
中文
738-739,747
2003-10-10(万方平台首次上网日期,不代表论文的发表时间)