基于主题词对的文档重排方法
信息检索中相关文档的排序一直是一个至关重要的问题.本文提出一种基于主题词对的文档重排方法,使得检索结果在保持召回率的前提下提高精确率.主题词对意指能够共同表征同一主题的两个词语,其中一个来自于查询,另一个来自于文档,两者之间具有紧密的联系.本文中,主题词对的选择采用概率潜在语义索引的方法,并根据主题词对在文档中的分布状况对其进行重排.对NTCIR-5中文信息检索的文档集合进行测试,采用trec标准评估方法,结果表明采用该方法使得精确率在rigid和relax结果集上分别提高了53.6%和55.8%.
主题词对 概率潜在语义索引 文档重排 信息检索
何婷婷 许婷 瞿国忠 涂新辉
清华大学软件学院,北京,102201;华中师范大学计算机科学系,武汉,430079 华中师范大学计算机科学系,武汉,430079
国内会议
沈阳
中文
197-201
2006-08-15(万方平台首次上网日期,不代表论文的发表时间)