会议专题

基于RSS的分布式博客搜索引擎设计

构建一个基于RSS的P2P分布式博客搜索引擎。利用Pastry协议,实现分布式博客采集系统的数据存储和传输。在各子采集系统上分别建立索引,分散了系统维护庞大索弓f的重负。实现分布式查询,提高了查询响应速度。利用RSS文件的结构化特性,数据采集系统能很好地跟踪博客站点的更新,从而达到对更新频繁的博客站点的实时搜索。

RSS Pastry 分布式 搜索引擎 博客站点

刘莉 肖诗斌 王涛 施水才

北京信息科技大学中文信息处理研究中心,北京,100101;北京拓尔思信息技术有限公司,北京,100101

国内会议

第三届全国信息检索与内容安全学术会议

苏州

中文

528-532

2007-11-01(万方平台首次上网日期,不代表论文的发表时间)