会议专题

基于短语结构抽取和对齐的机器翻译模板自动获取方法

本文提出了一种从未经标注的双语口语语料库中自动获取机器翻译模板的方法.这种算法是一种无监督的、基于统计的、数据驱动的方法.这种方法有两个基本的步骤.首先,通过语法归纳分别从源语言和目标语言中获取语义类和短语结构类.然后,利用双语划界文法将短语结构类进行对齐.对齐的结果经过后处理就可以得到翻译的模板.初步的试验结果表明,本方法可以达到比较令人满意的效果,是有效的和切实可行的.

双语语法 翻译模板 结构对齐 机器翻译 语料库

胡日勒 宗成庆 徐波

中国科学院自动化研究所模式识别国家重点实验室(北京)

国内会议

第二届全国学生计算语言学研讨会

北京

中文

363-368

2004-08-01(万方平台首次上网日期,不代表论文的发表时间)