会议专题

平衡IO和CPU的XML关键词检索技术

由于当前XML在数据交换和数据存储中的普遍应用,基于XML文档的信息检索研究已经成为新的研究热点。XML文档本身含有结构信息可以使其检索精度得到相当大的提高。但相应地,XML检索中使用的更复杂的评分模型(如组合语言模型和推理网络的结构化评分模型)和更细的返回结果粒度(由文档转变为元素或者段落),也使得传统的信息检索由I/O密集型应用转变为CPU密集型应用。针对上述应用特点的转变,我们提出了一种新的检索处理模型,即保存数据的两种索引形式,根据系统的状态动态调整任务的调度,平衡I/O和CPU的处理,以达到减少单个查询的平均响应时间。

结构化检索 语言模型 关键词检索

李求实 王秋月 王珊

数据工程与知识工程 教育部重点实验室(中国人民大学),北京 100872 中国人民大学 信息学院,北京 100872

国内会议

NDBC2009第26届中国数据库学术会议

南昌

中文

378-390

2009-10-15(万方平台首次上网日期,不代表论文的发表时间)