会议专题

跨语言信息检索中查询关键词翻译转换算法

跨语言信息检索中,输入的查询语句往往是一系列关键词组合,而不是一个完整的句子。这样一来,查询关键词序列由于缺乏必要的语境、语法信息,给查询语句的翻译转换得来了很大的困难。本文基于大规模双语语料库,以向量空间模型和词汇同现互信息为理论基础,运用传统单语信息检索技术,将查询关键词翻译转换问题转换为关键词词典义项的boost值计算。试验结果表明,检索结果中前10篇文档的准确率达92.8%,检索结果中前100篇文档的准确率也达88.9%,基本上满足了跨语言信息检索的实际要求。

跨语言信息检索 关键词 翻译转换 双语语料库

张孝飞 代六玲 黄河燕 陈肇雄

中国科学院计算机语言信息工程研究中心,北京 10083 北京理工大学计算机学院,北京 100083

国内会议

2005全国网络与信息安全技术研讨会

北京

中文

91-97

2005-08-30(万方平台首次上网日期,不代表论文的发表时间)