融合语态特征的日英层次短语翻译模型
针对不同语种的被动和可能语态的句法结构差异影响机器翻译质量的问题,提出融合语态特征的最大熵翻译模型。首先从日语端分出被动语态、可能语态和其他语态,然后从英语端对被动和可能语态进一步分类,抽取双语特征训练最大熵规则分类模型,将语态特征融合入对数线性模型中以改善翻译模型。提高解码器在翻译被动语态和可能语态时规则选择的准确性。实验结果表明,该方法可以有效地改善日英统计机器翻译的句法结构调序和词汇翻译,提升被动语态和可能语态句子的翻译质量。
被动语态 可能语态 统计机器翻译 最大熵模型
王楠 徐金安 明芳 陈钰枫 张玉洁
北京交通大学计算机与信息技术学院,北京 100044
国际会议
第五届自然语言处理与中文计算会议(NLPCC-ICCPOL2016)
昆明
中文
1-9
2016-12-02(万方平台首次上网日期,不代表论文的发表时间)