会议专题

基于伪文档的伪相关反馈方法

传统的伪相关反馈(Pseudo Relevance Feedback,PRF)方法通常是以文档作为扩展源单元提取扩展词,提取粒度过大造成扩展源质量下降,使得检索结果鲁棒性差.该文研究利用主题分析技术,尝试将文本语义内容作为扩展源单元,缓解扩展源质量不高的问题.提出并实现了对文本集中各文档内容的伪文档描述,通过对其进行隐式多样化处理,实现了从更细微的文本内容角度出发提取扩展词.通过在真实NTCIR8中文语料的检索结果表明,该方法可以有效的提升伪相关反馈的检索性能.

伪文档 伪相关反馈 主题分析 检索性能

闫蓉 高光来

内蒙古大学 计算机学院,内蒙古 呼和浩特 010021

国内会议

第十五届全国计算语言学学术会议(CCL2016)暨第四届基于自然标注大数据的自然语言处理国际学术研讨会(NLP-NABD-2016)

烟台

中文

1-10

2016-10-14(万方平台首次上网日期,不代表论文的发表时间)