基于改进潜在语义分析的交叉语言检索

摘要：

本文采用基于SVD和NMF矩阵分解相结合的改进潜在语义分析的方法为生物医学文献双语摘要进行建模，该模型将英汉双语摘要映射到同一语义空间，不需要外部词典和知识库，自动处理不同语言之间的对应关系，在双语空间中进行检索，并综合考虑两种矩阵分解结果。充分利用医学文献双语摘要语料中的锚信息，通过不同的k值构建多个检索模型，计算每个模型的信任度，使得多个模型都对查询和文本的相似度做出贡献。在语义空间上进行项与项、文本与文本、项与文本之间的相似度计算，实现了双语摘要的交叉检索，取得了较好的实验效果。

关键词：改进潜在语义分析语义空间双语语料交叉检索

作者: 宁健林鸿飞

作者单位: 大连理工大学计算机科学与工程系,大连,116024

会议类型: 国内会议

会议名称: 第五届全国信息检索学术会议CCIR2009

会议地点: 上海

会议语种:中文

页码: 605-614

在线出版日期: 2009-11-14（万方平台首次上网日期，不代表论文的发表时间）

会议专题

基于改进潜在语义分析的交叉语言检索