会议专题

crlib:可交互异构Crawler框架的设计与实现

为了简化Crawler的开发流程及更新代价,本文提出Crawler的通用内核crlib,crlib抽象出Crawler的基本功能,以动态库的形式嵌入具体Crawler实例当中.crlib不仅提供了可定制的应用接口,还提供了可交互式的对Crawler工作流程进行控制的消息接口,该接口标准化了Crawler各组件之间的通信机制.

计算机网络 信息采集 通信接口

刘宝良 李建中

哈尔滨工业大学计算机学院数据库技术研究中心(哈尔滨)

国内会议

第二十届全国数据库学术会议

长沙

中文

738-739,747

2003-10-10(万方平台首次上网日期,不代表论文的发表时间)