会议专题

基于倒排索引的全文检索系统的研究

  简要介绍了全文检索的背景和作用,以及与使用数据库进行结构化数据查询的区别。采用Heritrix进行数据获取,进行相应的文本内容提取;而后基于文本内容构建倒排索引,采用Lucene进行索引的构造和全文检索,完成了全文检索系统的开发,并对检索效率进行了优化。

全文检索系统 文本信息 倒排索引 信息检索库

彭涛 孙连英 刘畅 鲍泓

北京联合大学信息学院软件工程系 北京 100101 北京联合大学信息服务工程北京市重点实验室 北京 100101 北京联合大学信息服务工程北京市重点实验室 北京 100101

国内会议

中国计算机用户协会网络应用分会2011年第十五届网络新技术与应用年会

北京

中文

238-239,257

2011-10-30(万方平台首次上网日期,不代表论文的发表时间)