会议专题

基于“松弛尺度”的短语翻译对抽取方法

短语对抽取是基于短语统计机器翻译方法的关键技术。当前广泛使用的Och提出的短语对抽取方法,过于依赖词对齐结果,因而只能抽取与词对齐完全相容的短语对。本文给出一种基于“松弛尺度”的短语抽取方法,对不能完全相容的短语对,结合词性标注信息和词典信息来判断是否进行抽取,放松“完全相容光”的限制,可以保证为更多的源短语找到目标短语。实验表明,该抽取方法的性能比Och的方法有明显的改善和提高。

短语对抽取 机器翻译 松弛尺度 短语翻译 词对齐

何彦青 周玉 宗成庆

中国科学院 自动化研究所 模式识别国家重点实验室 北京 100080

国内会议

第九届全国计算语言学学术会议

大连

中文

392-397

2007-08-06(万方平台首次上网日期,不代表论文的发表时间)