使用内存汇集的新闻搜索索引更新
本文介绍了一个适用于新闻搜索应用的索引更新算法,称为基于汇集(pooling)的在线索引更新算法(POIU).它使用一种新型的混合式在线索引更新策略,通过在内存中对倒排表进行汇集,可以快捷高效地把短的倒排表成批地筛选出来,使得为数众多、增长缓慢的短倒排表能够在内存池保留下来,有利于更有效的合并更新.同时,本文说明了实现这个POIU算法所需的一种索引词表的高效缓存和查找技术.本文还对系统的实现情况和试验结果作了说明,并讨论了POIU算法对于新闻搜索索引更新的适用条件.
信息检索 索引更新 新闻搜索 搜索引擎 内存汇集
孙斌
北京大学计算语言学研究所,北京.100871
国内会议
北京
中文
432-441
2008-11-15(万方平台首次上网日期,不代表论文的发表时间)