面向形态丰富语言的多粒度翻译融合
形态丰富语言由于其复杂的形态变化,会导致大词汇量和数据稀疏问题,这给统计机器翻译带来了巨大挑战。该文通过将这类语言表示为不同的粒度,然后分别进行翻译;由于不同的拉度能表征语言不同层面的特点,通过对不同粒度的翻译结果进行词级系统融合,便可生成更好的译文。维吾尔语、蒙古语到汉语的两组翻译实验表明,这种多拉度系统融合方法改善了翻译效果,BLEU值比最好的单系统分别提高了+1.41%和+2.03%。
形态丰富语言 粒度分析 机器翻译 系统融合
王志洋 吕雅娟 刘群
中国科学院计算技术研究所,中国科学院智能信息处理重点实验室,北京 100190 中国科学院研究生院,北京 100049 中国科学院计算技术研究所,中国科学院智能信息处理重点实验室,北京 100190
国内会议
呼和浩特
中文
75-81
2011-07-29(万方平台首次上网日期,不代表论文的发表时间)