基于最大熵短语重排序模型的特征抽取算法改进
本文针对统计机器翻译中基于最大熵短语重排序模型特征抽取算法。提出一种改进算法。该算法能够抽取出更多准确的短语重排序信息,特别是逆序短语的特征信息,解决了原算法中最大熵训练时特征数据不平衡问题,即保序短语特征信息数量远超过逆序短语信息数量,提高了翻译中短语重排序的准确率。本文以NIST MT 05作为汉语到英语翻译的测试集,实验结果表明改进后的系统BLEU值比原系统提高0.65%。
最大熵 特征抽取 统计机器翻译 重排序模型
孙萌 姚建民 吕雅娟 刘群 姜文斌
中国科学院 计算技术研究所,北京 100080 苏州大学计算机科学与技术学院,苏州 215006 苏州大学计算机科学与技术学院,苏州 215006 中国科学院 计算技术研究所,北京 100080
国内会议
武汉
中文
275-281
2010-10-11(万方平台首次上网日期,不代表论文的发表时间)