检索主题难易度预测
TREC2004 Robust任务有一项新要求,就是要把检索主题按照从易到难的顺序排列.针对新要求,该文提出了基于单词歧义性大小的检索主题难易度模型.根据WordNet和它附带的Brown语料库构造了单词义项分布词典,然后把检索主题中的单词按歧义性大小分为七类,通过计算平均单词容易度来度量检索主题的难度.实验结果表明该模型有一定的预测能力.最后预测了TREC2004 Robust任务的250个检索主题的难易度.
信息检索 文本检索 检索主题 义项分布
吕学强 赖治国 昝红英 项锟
北京大学计算语言学研究所(北京)
国内会议
上海
中文
92-98
2004-11-01(万方平台首次上网日期,不代表论文的发表时间)