会议专题

基于相关子主题消解的悖向重排序方法研究

悖向重排序是一种面向个性化信息检索的新型排序策略,其借助相悖于查询意图的描述结构,实现倔强非相关反馈的识别和降解。目前,悖向重排序研究中的关键问题之一是如何建立极大区别于查询意图且最具代表性的悖向意图描述。针对这一问题,本文研究一种基于相关子主题消解的悖向重排序方法,主要研究内容包括如下四个方面:1)基于相关反馈内容切割和聚类的子主题挖掘;2)基于信息量和分布特性的相关子主题判定;3)悖向查询意图中相关子主题的消解;4)基于悖向意图的检索结果重排序。实验采用TDT4语料集进行测试,结果显示该悖向排序方法显著改进了检索性能,其MAP值提高了近16个百分点,P@20 和NDCG@20分别提高了14%和12%。

信息检索 重排序 查询意图 文本分割 相关子主题消解

华松 洪宇 张剑峰 姚建民 朱巧明

苏州大学江苏省计算机信息处理重点实验室,苏州市,215006

国内会议

第六届全国信息检索学术会议

黑龙江镜泊湖

中文

237-250

2010-08-12(万方平台首次上网日期,不代表论文的发表时间)