会议专题

使用内存汇集的新闻搜索索引更新

本文介绍了一个适用于新闻搜索应用的索引更新算法,称为基于汇集(pooling)的在线索引更新算法(POIU).它使用一种新型的混合式在线索引更新策略,通过在内存中对倒排表进行汇集,可以快捷高效地把短的倒排表成批地筛选出来,使得为数众多、增长缓慢的短倒排表能够在内存池保留下来,有利于更有效的合并更新.同时,本文说明了实现这个POIU算法所需的一种索引词表的高效缓存和查找技术.本文还对系统的实现情况和试验结果作了说明,并讨论了POIU算法对于新闻搜索索引更新的适用条件.

信息检索 索引更新 新闻搜索 搜索引擎 内存汇集

孙斌

北京大学计算语言学研究所,北京.100871

国内会议

第四届全国信息检索与内容安全学术会议

北京

中文

432-441

2008-11-15(万方平台首次上网日期,不代表论文的发表时间)