会议专题

基于统计和模板的双层汉民翻译研究

为了提高汉民翻译系统的翻译准确率,本文提出了在短语基础上结合模板的方法自动抽取模板结构;解码时,首先进行模板匹配,套用模板结构进行翻译,然后再按照Beam Search搜索算法进行后续翻译。因此,该方法可以有效地解决单一的统计翻译中语序错误。以汉蒙翻译为例,实验结果显示此方法可以有效地提高翻译效果。在农业领域的汉民翻译中添加了农业常用短语模板,翻译效率比Och的基于短语的统计翻译方法提高10%。

统计机器翻译 模板抽取 短语模型 解码 汉蒙翻译系统 模板匹配

骆凯 李淼 强静 乌达巴拉

中国科学院合肥智能机械研究所,安徽 合肥 230031 中国科学技术大学信息科学技术学院,安徽 合肥 230027 中国科学院合肥智能机械研究所,安徽 合肥 230031

国内会议

第二届全国少数民族青年自然语言处理学术研讨会

合肥

中文

286-292

2008-10-07(万方平台首次上网日期,不代表论文的发表时间)