一种基于状态转移的N元语言模型快速查询方法

摘要：

　　融合基于海量语料的语言模型是提高统计机器翻译系统性能的有效手段。随着模型规模的不断增加，如何实现语言模型的快速查询成为影响系统性能的关键。本文根据N元语言模型查询具有的上下文相关特性，提出—种基于状态转移的语言模型快速查询方法。该方法通过构造Trie树索引保存查询状态，有效避免了语言模型的重复查询。实验结果表明，该方法在严格控制语言模型规模的基础上，能够显著提高统计机器翻译系统的解码效率。

关键词：统计机器翻译 N元语言模型快速查询状态转移数据结构

作者: 付晓寅魏玮徐波

作者单位: 中国科学院自动化所,数字内容技术与系统研究中心,北京,100190

会议类型: 国内会议

会议名称: 第七届全国机器翻译研讨会

会议地点: 厦门

会议语种:中文

页码: 194-199

在线出版日期: 2011-09-23（万方平台首次上网日期，不代表论文的发表时间）

会议专题

一种基于状态转移的N元语言模型快速查询方法