影响统计翻译系统性能的因素分析
统计翻译方法已经成为目前国际上机器翻译研究的主流方法,但对于一个统计翻译系统来说,哪些因素是影响系统性能的关键因素,它们对系统性能的影响有多大,并没有相关的文献对此做详细的调研和分析.本文以基于短语的(phrase-based)统计翻译系统为例,针对影响系统性能的几个因素做了一系列实验,并对其进行了详细地分析.实验结果表明:影响基于短语的统计翻译系统性能的主要因素依次为系统模型选择的特征、训练语料的规模和预处理.
统计机器翻译 翻译模型 系统性能 实验分析
柴春光 宗成庆
中国科学院自动化研究所模式识别国家重点实验室,北京,100080
国内会议
沈阳
中文
383-387
2006-08-15(万方平台首次上网日期,不代表论文的发表时间)