语音识别码本状态间的线性和非线性相关性

摘要：

目前很多语音识别的快速自适应算法都把最大限度地利用声学模型(码本)参数的先验信息作为主要手段,尤其是码本状态间的相关性,在这类自适应算法中用得非常普遍.由于自适应算法对于数据和时间的需要,这类算法往往只能利用状态间的线性相关性,对于非线性相关性,则不但无法利用,而且无法度量.信息论中以互信息的方法来度量相关性(包括线性和非线性相关性),但实际算法中这需要大量的统计数据,无法适用于以说话人为样本的码本分量相关性计算.本文提出一种利用预测残差来度量随机变量相关性的方法,并给出分段预测相关指数和多项式预测相关指数两类相关性测度.在模拟数据上实验结果显示这种相关性的测度是合理而有效的.利用这两类相关性测度,我们详细地分析了码本状态间的相关性,讨论了线性相关性和非线性相关性的关系.结论表明,当两个状态是强相关时,非线性相关性可以忽略,因此,在快速自适应算法中从线性相关性入手是合理的.

关键词：语音识别声学模型自适应算法码本状态间相关性

作者: 余鹏王作英

作者单位: 清华大学电子工程系语音实验室

会议类型: 国内会议

会议名称: 第六届全国人机语音通讯学术会议

会议地点: 深圳

会议语种:中文

页码: 273-276

在线出版日期: 2001-11-20（万方平台首次上网日期，不代表论文的发表时间）

会议专题

语音识别码本状态间的线性和非线性相关性