基于锚词对的英汉双语语段对齐模型
对双语语料库进行语段级对齐是基于实例的机器翻译(EBMT)的基础.本文提出了基于锚词对的英汉双语语段对齐模型并给出了相应的对齐算法,解决了中、小规模语料库的数据稀疏问题.系统把语段切分的歧义推迟到语段对齐时排除,提高了语段切分的正确率.试验表明模型具有较高有效性.
语段对齐 机器翻译 英汉双语 双语语料库
吴尉林 屈刚 陆汝占
上海交通大学计算机科学与工程系(上海)
国内会议
哈尔滨
中文
425-430
2003-08-01(万方平台首次上网日期,不代表论文的发表时间)