基于最长名词短语分治策略的神经机器翻译
神经机器翻译自兴起以来,不断给机器翻译领域带来振奋人心的消息.但神经机器翻译没有显式地利用语言学知识对句子结构进行分析,因此对结构复杂的长句翻译效果不佳.本文基于分治法的思想,识别并抽取句子中的最长名词短语,保留特殊标识或核心词与其余部分组成句子框架.通过神经机器翻译系统分别翻译最长名词短语和句子框架,再将译文重新组合的方法,缓解了神经机器翻译对句子长度敏感的问题.实验结果表明,本文提出的方法获得的译文与基线系统相比,BLEU分值提升了0.89.
神经机器翻译 最长名词短语 分治策略
张学强 蔡东风 叶娜 吴闯
沈阳航空航天大学 人机智能研究中心,辽宁 沈阳 110136
国内会议
第十六届全国计算语言学学术会议暨第五届基于自然标注大数据的自然语言处理国际学术研讨会
南京
中文
1-8
2017-10-13(万方平台首次上网日期,不代表论文的发表时间)