会议专题

基于分布式的全文检索系统的研究和设计

本文研究了在分布式环境下如何构建全文检索系统.Lucene全文检索技术是信息检索领域广泛使用的基本技术,它是一个优秀的开源全文本搜索技术框架.Hadoop不仅是一个用于存储的分布式文件系统,而且是用来在由通用计算设备组成的大型集群上执行分布式应用的框架.本文首先介绍这两种开源工具,然后将其引入具体应用,给出了一个基于Hadoop的分布式的全文检索系统模型.

distributed full-text retrieval system Lucene Hadoop Map/Reduce

赵娟 董科军

中国科学院计算机网络信息中心 北京 100190

国内会议

第九届科学数据库与信息技术学术讨论会

桂林

中文

329-338

2008-10-01(万方平台首次上网日期,不代表论文的发表时间)