会议专题

基于篇章上下文的统计机器翻译方法

  上下文信息对于统计机器翻译(SMT)中的规则选择是很重要的,但是之前的SMT模型并没有充分利用上下文信息。在本文中,我们提出了一种利用篇章上下文信息的方法来提高规则选择的准确性,从而提高翻译的质量。首先我们利用向量空间模型获得训练语料的文档和测试集中文档的相似度,然后把相似度作为一个新的特征加入到短语模型中。实验结果表明,在英语到汉语的翻译工作中,我们的方法可以显著提高翻译质量。在NIST-08和CWMT-08两个测试集上BuEU值都有显著的提高。

统计机器翻译 上下文信息 向量空间模型

于惠 谢军 熊皓 吕雅娟 刘群 林守勋

中国科学院计算技术研究所,智能信息处理重点实验室,北京,100190

国内会议

第七届全国机器翻译研讨会

厦门

中文

213-219

2011-09-23(万方平台首次上网日期,不代表论文的发表时间)