会议专题

跨语言信息检索中的用户查询翻译方法研究

用户的查询翻译是跨语言信息检索的一个非常重要的任务,翻译结果的准确性直接影响检索结果的查准率和查全率。本文提出了三种方法以解决跨语言信息检索中查询翻译的歧义问题。其中,基于知网(HowNet)语义关系的译词选择模型,通过下上文的语义关系网络获得译词;双语衰减共现模型在考虑共现距离值的情况下统计双语语料的词汇共现信息,并考虑了关键词距离的因素;义原衰减共现模型根据词汇的不同类别进行共现统计,解决了由于语料稀疏造成的实际性能下降的问题。本文结合上述三种模型的特点,找到了一种逐步寻优的最佳算法。实验结果表明,该方法获得了比较好的精确度。

跨语言信息 统计方法 查询翻译 译词选择 信息检索 用户查询

朱红垒 郑德权 赵铁军

哈尔滨工业大学教育部-微软语言语音重点实验室,哈尔滨 150001

国内会议

2008年中国信息技术与应用学术论坛

成都

中文

330-332

2008-04-01(万方平台首次上网日期,不代表论文的发表时间)