基于词对齐的双语组块对齐
本文提出了一种基于词对齐的双语组块对齐的方法.它利用已有的词对齐信息和英语组块识别结果,进行汉语组块的识别和双语组块的对齐.通过对双语组块对齐实例的分析,我们将组块对齐分为三种情况:(1)双语组块对应连续(2)双语组块对应不连续(3)组块合并情况.根据这三种情况,我们提出三种不同算法,进行双语组块对齐.实验结果表明,该方法的正确率和召回率分别达到90.76﹪,88.59﹪.
双语组块对齐 组块获取 词对齐 语料库 机器翻译
任登君 李珩 张俐 姚天顺
东北大学信息学院计算机软件与理论研究所(辽宁沈阳)
国内会议
北京
中文
326-331
2004-08-01(万方平台首次上网日期,不代表论文的发表时间)