会议专题

一种扩展的汉语统计二元文法语言模型

该文提出了一种扩展的统计汉语二元文法语言模型,以汉语的同一个句子中的最有效预测词对来弥补二元文法的不足,有效的描述了汉语中词语组合的长距离位移现象,同时提出了最小复杂度准则的有效词对发现算法,克服了互信息准则忽略了各种语言预测单元信息覆盖的缺点,这种语言模型比传统词组合模型计算复杂度低,训练可靠,且克服了一般语言模型集成中盲目插值、不能结合实际上下文的缺点。

语音识别 汉语统计语言模型 语言模型复杂度 互信息准则 词组合信息

田斌 易克初

电子科技大学综合业务网国家重点实验室

国内会议

第九届全国信号处理学术年会

北京

中文

184~187

1999-10-01(万方平台首次上网日期,不代表论文的发表时间)