基于分布式的全文检索系统的研究和设计
本文研究了在分布式环境下如何构建全文检索系统.Lucene全文检索技术是信息检索领域广泛使用的基本技术,它是一个优秀的开源全文本搜索技术框架.Hadoop不仅是一个用于存储的分布式文件系统,而且是用来在由通用计算设备组成的大型集群上执行分布式应用的框架.本文首先介绍这两种开源工具,然后将其引入具体应用,给出了一个基于Hadoop的分布式的全文检索系统模型.
distributed full-text retrieval system Lucene Hadoop Map/Reduce
赵娟 董科军
中国科学院计算机网络信息中心 北京 100190
国内会议
桂林
中文
329-338
2008-10-01(万方平台首次上网日期,不代表论文的发表时间)