会议专题

基于标志词的EBMT翻译单元抽取方法

EBMT技术的关键问题之一是如何能取得较好的翻译单元.传统的方法有通过双语语料的词语对齐来取得对译片断,也可通过对句子的分析(如依存分析)、根据句子分析结果来获取翻译单元.然而词语对齐或句子分析结果都存在一定误差,这对翻译单元的抽取产生了负面的影响.本文试图通过汉英双语标志词(Marker)找到一种新的翻译单元的抽取的方法.该方法不需辅助的自然语言处理技术,在关于奥运的体育领域的上获得了较好的效果.在此方法上,我们实现了一个EBMT系统,该系统取得了较好的翻译效果.

机器翻译 翻译单元抽取 标志词假设 双语语料

刘海洁 时晓升 姚建民 李生

哈尔滨工业大学计算机科学与技术学院(黑龙江哈尔滨)

国内会议

第二届全国学生计算语言学研讨会

北京

中文

289-294

2004-08-01(万方平台首次上网日期,不代表论文的发表时间)