会议专题

检索主题难易度评价

TREC2004 Robust任务有一项新要求,就是要把检索主题按照从易到难的顺序排列.针对新的要求,提出了基于单词歧义性大小的检索主题难易度模型.根据WordNet和它附带的Brown语料库构造了单词义项分布词典,再把检索主题中的单词按歧义性大小分为7类,通过计算平均单词容易度来度量检索主题的难度.实验结果表明,该模型有一定的预测能力.最后用此模型预测了TREC2004 Robust任务的250个检索主题的难易度。

信息检索 文本检索 鲁棒性任务 检索主题难易度 义项分布

吕学强 赖治国 孙斌 俞士汶

北京大学,计算语言学研究所,北京,100871;北京信息科技大学,北京,100101 北京大学,计算语言学研究所,北京,100871

国内会议

第三届全国搜索引擎和网上信息挖掘学术研讨会

北京

中文

1833-1837

2005-09-26(万方平台首次上网日期,不代表论文的发表时间)