会议专题

面向汉阿句法短语库构建的阿语短语分析

基于平行语料库的机器翻译研究是机器翻译的研究重点。平行语料库为机器学习翻译所需的句法规则提供了保障,也为统计机器翻译提供了资源。本文选择联合国官方资料库作为汉阿文本对齐语料,建立短语对齐.首先,利用斯坦福句法分析器对语料进行句法标注加工,进而抽取双语短语结构,构建汉阿句法短语库.在短语库的构建过程中,发现阿语语料的句法标注存在一些问题,因此本文着重对阿语标注中的这些问题进行分析.本文共抽取了9 种阿语短语结构共43796 条,统计短语结构分布,并着重对名词性短语结构和动词性短语结构中的句法标注错误实例进行归类总结,分析错误产生的原因.

汉阿翻译 机器翻译 短语结构 句法短语库 句法分析器

Alaa Mamdouh Akef 杨尔弘 王莹莹

北京语言大学国家语言资源监测与研究平面媒体中心,北京100083;北京语言大学信息科学学院,北京100083

国内会议

第十二届全国机器翻译研讨会

乌鲁木齐

中文

77-84

2016-08-25(万方平台首次上网日期,不代表论文的发表时间)