利用1-m词对齐信息改善统计机器翻译性能

词对齐是目前主流的统计机器翻译系统必备的模块,而IBM模型是词对齐最常用的模型,但是IBM模型不允许源语到目标语的一对多词对齐,这一限制在像汉英翻译这样频繁出现一对多对齐现象的任务中,影响了翻译系统的性能。 本文针对这个问题,通过将目标语中满足一定条件的bigram合并,把一对多问题简化为一对一问题,进而改善词对齐的效果,最终达到提高统计机器翻译系统性能的目的。实验结果表明,该方法能够在一定程度上提高汉英翻译的性能。
文字处理 机器翻译性能 词汇对齐 数理语言学
陈如山 肖桐 朱靖波
东北大学自然语言处理实验室,沈阳,110004
国内会议
太原
中文
330-335
2008-07-23(万方平台首次上网日期,不代表论文的发表时间)