会议专题

一种基于状态转移的N元语言模型快速查询方法

  融合基于海量语料的语言模型是提高统计机器翻译系统性能的有效手段。随着模型规模的不断增加,如何实现语言模型的快速查询成为影响系统性能的关键。本文根据N元语言模型查询具有的上下文相关特性,提出—种基于状态转移的语言模型快速查询方法。该方法通过构造Trie树索引保存查询状态,有效避免了语言模型的重复查询。实验结果表明,该方法在严格控制语言模型规模的基础上,能够显著提高统计机器翻译系统的解码效率。

统计机器翻译 N元语言模型 快速查询 状态转移 数据结构

付晓寅 魏玮 徐波

中国科学院自动化所,数字内容技术与系统研究中心,北京,100190

国内会议

第七届全国机器翻译研讨会

厦门

中文

194-199

2011-09-23(万方平台首次上网日期,不代表论文的发表时间)