会议专题

基于双向线性变换的可比语料双语词典抽取重排序方法

近几年来,一种基于词嵌入的线性变换方法在可比语料双语词典抽取任务上取得了显著的效果.这种方法假定双语词嵌入空间在翻译时满足线性关系,然而,在实际中,双语词嵌入空间的线性假设在单语词嵌入的训练中并不能得到很好的保证,这使得在源语言到目标语言和目标语言到源语言两个方向上学习到的线性变换并不一致.为此,对给定的待翻译词的翻译候选N-best 列表,本文综合了上述两个方向的线性变换得分,提出了一种基于双向线性得分的重排序方法.在汉英方向的双语词典抽取任务上的实验表明,相比单向线性基准方法,这种重排序方法能够显著提升抽取到的字典的准确度,在Top-1 排名上能够提升69%.

可比语料 双语词典抽取 重排序方法 双向线性变换

张春越 赵铁军

哈尔滨工业大学 计算机科学与技术学院 机器智能与翻译研究室,黑龙江省哈尔滨市 150001

国内会议

第十二届全国机器翻译研讨会

乌鲁木齐

中文

1-8

2016-08-25(万方平台首次上网日期,不代表论文的发表时间)