基于倒排索引的全文检索系统的研究
简要介绍了全文检索的背景和作用,以及与使用数据库进行结构化数据查询的区别。采用Heritrix进行数据获取,进行相应的文本内容提取;而后基于文本内容构建倒排索引,采用Lucene进行索引的构造和全文检索,完成了全文检索系统的开发,并对检索效率进行了优化。
全文检索系统 文本信息 倒排索引 信息检索库
彭涛 孙连英 刘畅 鲍泓
北京联合大学信息学院软件工程系 北京 100101 北京联合大学信息服务工程北京市重点实验室 北京 100101 北京联合大学信息服务工程北京市重点实验室 北京 100101
国内会议
中国计算机用户协会网络应用分会2011年第十五届网络新技术与应用年会
北京
中文
238-239,257
2011-10-30(万方平台首次上网日期,不代表论文的发表时间)