基于N-gram的句子相似度计算技术
在基于大规模双语语料库的机器翻译研究中,如何找到最有效的翻译参考一直以来都是人们的关注焦点,其核心技术就是参考例句的相似度计算。本文提出了一种基于HowNet词语相似度的N-gram相似度计算方法,在此基础之上,参考机器翻译自动评测中BLEU的评价公式,进一步提出了一种新的句子相似度计算方法。该方法结合了N-gram和语义相似度计算,可以有效应用到基于实例的机器翻译、辅助机器翻译和交互式机器翻译中。
句子相似度 双语语料库 机器翻译 相似度计算 语义相似度
宋彦 张桂平 蔡东风
沈阳航空工业学院知识工程中心 沈阳 110034 沈阳航空工业学院人机智能研究中心 沈阳 110034
国内会议
大连
中文
416-421
2007-08-06(万方平台首次上网日期,不代表论文的发表时间)