会议专题

西安理工大学统计机器翻译系统技术报告

  本文主要介绍了西安理工大学参加2011年全国统计机器翻译研讨会机器翻译评测活动中所使用的统计机器翻译系统及相关技术。共计参加了2个翻译任务:汉英新闻翻译和英汉科技翻译。主要使用了3个单系统:Moses,Moses-chart和Joshua。另外,在英汉科技任务中使用了基于MBR的多系统融合框架。在数据处理方面,定义了两种噪声:格式噪声和语义噪声。针对此两种噪声,我们提出多种措施和方法对模型训练数据进行了深入的分析和净化,实验和评测结果表明,本文所提出的策略是行之有效的。

统计机器翻译系统 系统融合 数据噪声 数据净化

杜金华 王莎

多语言信息处理与交互研究室,西安理工大学自动化与信息工程学院,西安,710048

国内会议

第七届全国机器翻译研讨会

厦门

中文

136-145

2011-09-23(万方平台首次上网日期,不代表论文的发表时间)