会议专题

基于双语句对语料库的词对齐模型

英汉词对齐技术中经常会遇到非登录词和因汉语的多样性和灵活性而产生的不利因素,直接或间接影响双语句对中词对齐的质量;但其本身具有的信息有利于改善词对齐质量.本文就是希望通过建立基于双语句对语料库的词对齐模型将句对之间的信息加以改进.主要包括:吕学强在其博士论文中提出的最小求交和最小求差模型以及这两种的混合模型(Ⅰ,Ⅱ)<””1”>.试验得出在特定词频条件下,混和模型(Ⅰ)具有相对较佳的效果,正确率达到0.7862﹪,召回率达到0.7558﹪,F1值达到0.7708﹪.

词对齐 语料库 机器翻译

陈晴 姚天顺

东北大学信息学院计算机系(辽宁);软件研究所(辽宁沈阳) 东北大学信息学院计算机系(辽宁)

国内会议

第二届全国学生计算语言学研讨会

北京

中文

354-356

2004-08-01(万方平台首次上网日期,不代表论文的发表时间)