会议专题

一种面向机器翻译的双语组块识别方法

指出双语组块最重要的特点是语义自足性、结构合法性和翻译转换的充分性,即识别出来的”双语组块”包含有确定的语义信息和双语对译信息,并且符合-定的语法规范。为此,相应地提出了一种双语组块分析方法。其基本思路是:通过规则与统计相结合,并充分利用双语对译信息,建立双语组块分析模型,以改善传统单语组块分析的不足,使之能更好的直接服务于机器翻译。经大规模语料实验,双语组块识别的准确率达71.6%,表明了本文算法的有效性。

双语组块 机器翻译 语料库 双语识别 双语对译

张孝飞 黄河燕 陈肇雄

中国科学院计算机语言信息工程研究中心 北京 100083

国内会议

第九届全国计算语言学学术会议

大连

中文

380-385

2007-08-06(万方平台首次上网日期,不代表论文的发表时间)