基于篇章上下文的统计机器翻译方法

摘要：

　　上下文信息对于统计机器翻译(SMT)中的规则选择是很重要的，但是之前的SMT模型并没有充分利用上下文信息。在本文中，我们提出了一种利用篇章上下文信息的方法来提高规则选择的准确性，从而提高翻译的质量。首先我们利用向量空间模型获得训练语料的文档和测试集中文档的相似度，然后把相似度作为一个新的特征加入到短语模型中。实验结果表明，在英语到汉语的翻译工作中，我们的方法可以显著提高翻译质量。在NIST-08和CWMT-08两个测试集上BuEU值都有显著的提高。

关键词：统计机器翻译上下文信息向量空间模型

作者: 于惠谢军熊皓吕雅娟刘群林守勋

作者单位: 中国科学院计算技术研究所,智能信息处理重点实验室,北京,100190

会议类型: 国内会议

会议名称: 第七届全国机器翻译研讨会

会议地点: 厦门

会议语种:中文

页码: 213-219

在线出版日期: 2011-09-23（万方平台首次上网日期，不代表论文的发表时间）

会议专题

基于篇章上下文的统计机器翻译方法