会议专题

深度学习在汉藏机器翻译中的应用研究

该文将深度学习技术应用于汉藏机器翻译任务中,采用了编码器-解码器结构.在编码阶段,首先将汉语句子中的每个词映射为定长的词向量,并通过循环神经网络压缩整个句子的全部信息.在解码过程中引入注意机制,使得解码器更集中的去注意当前翻译词的上下文依赖词,并每次选择概率最大的翻译词生成目标句子.该文使用上述方法在以法律文本、政府公文、新闻为主的书面语语料和口语类语料上进行实验.实验数据表明,在书面语语料上,NIST 和BLEU 值分别达到了6.39 和0.296,在口语语料上,NIST和BLEU 值分别达到了5.41 和0.222.在相同的语料上,以短语为基本单元的Moses 翻译模型的性能,书面语语料NIST 和BLEU 值为6.98 和0.335,口语语料NIST 和BLEU 值为6.24 和0.272.

机器翻译 深度学习 编码器-解码器结构 注意机制 词向量

李博涵 刘汇丹 龙从军 吴健

中国科学院软件研究所,北京 100190;中国科学院大学,北京 100049 中国科学院软件研究所,北京 100190 中国科学院软件研究所,北京 100190;中国社会科学院民族学与人类学研究所,北京 100081

国内会议

第十二届全国机器翻译研讨会

乌鲁木齐

中文

54-60

2016-08-25(万方平台首次上网日期,不代表论文的发表时间)