基于改进潜在语义分析的交叉语言检索
本文采用基于SVD和NMF矩阵分解相结合的改进潜在语义分析的方法为生物医学文献双语摘要进行建模,该模型将英汉双语摘要映射到同一语义空间,不需要外部词典和知识库,自动处理不同语言之间的对应关系,在双语空间中进行检索,并综合考虑两种矩阵分解结果。充分利用医学文献双语摘要语料中的锚信息,通过不同的k值构建多个检索模型,计算每个模型的信任度,使得多个模型都对查询和文本的相似度做出贡献。在语义空间上进行项与项、文本与文本、项与文本之间的相似度计算,实现了双语摘要的交叉检索,取得了较好的实验效果。
改进潜在语义分析 语义空间 双语语料 交叉检索
宁健 林鸿飞
大连理工大学计算机科学与工程系,大连,116024
国内会议
上海
中文
605-614
2009-11-14(万方平台首次上网日期,不代表论文的发表时间)