会议专题

融合多类特征的Web查询意图识别

识别搜索引擎用户的查询意图是在信息检索领域一个备受关注的研究内容。本文提出了一种融合多类特征识别web 查询意图的方法。具体地,本方法将Web 查询意图识别作为一个分类问题,并从不同类型的资源包括查询文本、搜索引擎返回内容以及Web查询日志中抽取出有效的分类特征。在人工标注的真实web查询语料上采用本文的方法进行查询意图识别实验,实验结果显示本文采用的各类特征对于提高查询意图识别的效果皆有一定帮助,综合使用这些特征对88.5%测试查询得到了准确的意图识别结果。

搜索引擎 Web查询意图 特征融合 信息检索

伍大勇 赵世奇 刘挺 张宇

哈尔滨工业大学信息检索研究中心,哈尔滨,150001 哈尔滨工业大学信息检索研究中心,哈尔滨,150001;百度,北京,100085

国内会议

第六届全国信息检索学术会议

黑龙江镜泊湖

中文

72-79

2010-08-12(万方平台首次上网日期,不代表论文的发表时间)