一种扩展的汉语统计二元文法语言模型

摘要：

该文提出了一种扩展的统计汉语二元文法语言模型，以汉语的同一个句子中的最有效预测词对来弥补二元文法的不足，有效的描述了汉语中词语组合的长距离位移现象，同时提出了最小复杂度准则的有效词对发现算法，克服了互信息准则忽略了各种语言预测单元信息覆盖的缺点，这种语言模型比传统词组合模型计算复杂度低，训练可靠，且克服了一般语言模型集成中盲目插值、不能结合实际上下文的缺点。

关键词：语音识别汉语统计语言模型语言模型复杂度互信息准则词组合信息

作者: 田斌易克初

作者单位: 电子科技大学综合业务网国家重点实验室

会议类型: 国内会议

会议名称: 第九届全国信号处理学术年会

会议地点: 北京

会议语种:中文

页码: 184～187

在线出版日期: 1999-10-01（万方平台首次上网日期，不代表论文的发表时间）

会议专题

一种扩展的汉语统计二元文法语言模型