会议专题

中文网页信息检索测试集的构建、分析及应用

随着WWW的迅速发展,Web信息检索技术成为研究者广泛关注的话题,但缺少合适的测试评测机制制约了中文网页信息检索技术的发展。参考国外测试集的构建经验,我们构建了大规模中文网页信息检索测试集CWT,并组织了SEWM中文网页检索评测,希望在国内外各个研究小组的共同参与下建立并完善CWT,一起推动中文网页信息检索技术的发展。论文在调研和分析国内外现有研究进展的基础上,详细介绍了CWT的构建原则和方法,并对CWT进行了有效的统计分析和实验研究。本文提出的构建测试集的方法为以后的研究提供了参考。

CWT 中文网页 信息检索 评测 测试集 文档集

李静静 闫宏飞

北京大学,北京 100871

国内会议

第三届全国信息检索与内容安全学术会议

苏州

中文

92-100

2007-11-01(万方平台首次上网日期,不代表论文的发表时间)