机器翻译自动评价中领域知识复述抽取研究
针对通用领域语料中抽取的复述在特定领域机器译文自动评价任务中应用容易导致复述匹配偏差的问题,提出采用抽取与测试领域相关的复述,来提高机器译文自动评价的方法。首先将通用单语训练语料进行聚类,并利用改进的M-L方法过滤,得到特定领域训练语料,然后在训练语料中利用Markov网络模型,抽取特定领域复述表,最后将此复述表应用在机器译文自动评价,以提高同义词和近义词的匹配精度。在WMT’14 Metrics task和WMT’15 Metrics task数据集上的实验结果表明,利用领域知识抽取的复述能够提高自动评价方法METEOR和TER与人工评价的相关性。
复述 机器译文自动评价 语言模型 Markov网络 文档聚类
张丽林 李茂西 肖文艳 万剑怡 王明文
江西师范大学计算机信息工程学院,南昌 330022
国际会议
第五届自然语言处理与中文计算会议(NLPCC-ICCPOL2016)
昆明
中文
1-9
2016-12-02(万方平台首次上网日期,不代表论文的发表时间)