统计机器翻译系统中传统词典的应用研究
词典是翻译系统中的重要资源。本文研究了将传统词典应用在统计机器翻译中的方法,包括在训练部分词典加权到语料中使用和解码部分引入词典特征融入log-linear模型来使用。本文还提出了一种词典匹配算法,使得实用的统计机器翻译系统具有动态添加新词的功能。实验表明,训练阶段中词典的主要作用是缓解数据稀疏问题;解码部分词典特征的引入使系统更加偏向于选择含有词典数目更多的译文。词典匹配算法的引入很好的改善了实用翻译系统中的用户体验,并能进一步提高翻译质量。
语言处理 机器翻译 词典匹配 数理语言学
曹杰 任志祥 吕雅娟 刘群
中国科学院计算技术研究所,中国科学院智能信息处理重点实验室,北京,100190
国内会议
北京
中文
169-177
2008-11-27(万方平台首次上网日期,不代表论文的发表时间)