会议专题

基于弱相关主题对齐的跨语言伪相关反馈

跨语言查询偏移的问题在非平行网页中尤为严重,本文针对可比性较差的非平行多语言检索文档,提出了一个基于弱相关主题对齐的跨语言伪相关反馈模型.利用翻译知识建立不同语言主题之间的对齐关系,并提出融合了翻译以及web同现特征的多语言词项相似度评分函数,从弱相关对齐主题中抽取有用的扩展词.该模型有助于改善跨语言查询偏移问题,适合对可比性较差的检索文档进行跨语言反馈扩展.

跨语言信息检索 伪相关反馈模型 弱相关主题对齐 非平行网页 数据挖掘

王序文 张强 王小捷 李军莲

中国医学科学院医学信息研究所,北京100020 国网电力科学研究院,北京102200 北京邮电大学,北京100876

国内会议

中国医学科学院/北京协和医学院医学信息研究所/图书馆2014年学术年会

北京

中文

138-145

2015-01-01(万方平台首次上网日期,不代表论文的发表时间)