会议专题

面向篇章机器翻译的英汉翻译单位和翻译模型研究

篇章机器翻译的首要问题是确定翻译单位.基于汉语和英语的语言知识和英汉翻译的实践,本文提出面向篇章机器翻译的基本单位和复合单位的双层单位体系,讨论了这两种单位支持篇章翻译应满足的性质,并据此勾画了篇章机器翻译的拆分、翻译、装配三步模型(PTA模型).本文提出,汉语篇章机器翻译的复合单位为广义话题结构对应的文本块,基本单位则是根据广义话题结构流水模型得到的话题自足句;英语篇章机器翻译的复合单位为句号句,基本单位为naming-telling小句(NT小句),即指称性成分加上对它的陈述或后修饰成分所构成的小句.本文展示了在这样的翻译单位体系下采用PTA模型的英汉翻译过程实例,规划了面向篇章翻译的英汉小句对齐语料库的建设任务,讨论了PTA模型的可行性.

篇章机器翻译 翻译单位 翻译模型 广义话题结构

宋柔 葛诗利

广东外语外贸大学外语研究与语言服务协同创新中心,广东 广州510420

国内会议

中国中文信息学会2015学术年会(CIPS2015)暨第十四届全国计算语言学学术会议(CCL2015)、第三届基于自然标注大数据的自然语言处理国际学术研讨会(NLP-NABD2015)

广州

中文

1-13

2015-11-13(万方平台首次上网日期,不代表论文的发表时间)