会议专题

基于N-gram的句子相似度计算技术

在基于大规模双语语料库的机器翻译研究中,如何找到最有效的翻译参考一直以来都是人们的关注焦点,其核心技术就是参考例句的相似度计算。本文提出了一种基于HowNet词语相似度的N-gram相似度计算方法,在此基础之上,参考机器翻译自动评测中BLEU的评价公式,进一步提出了一种新的句子相似度计算方法。该方法结合了N-gram和语义相似度计算,可以有效应用到基于实例的机器翻译、辅助机器翻译和交互式机器翻译中。

句子相似度 双语语料库 机器翻译 相似度计算 语义相似度

宋彦 张桂平 蔡东风

沈阳航空工业学院知识工程中心 沈阳 110034 沈阳航空工业学院人机智能研究中心 沈阳 110034

国内会议

第九届全国计算语言学学术会议

大连

中文

416-421

2007-08-06(万方平台首次上网日期,不代表论文的发表时间)