语音识别码本状态间的线性和非线性相关性
目前很多语音识别的快速自适应算法都把最大限度地利用声学模型(码本)参数的先验信息作为主要手段,尤其是码本状态间的相关性,在这类自适应算法中用得非常普遍.由于自适应算法对于数据和时间的需要,这类算法往往只能利用状态间的线性相关性,对于非线性相关性,则不但无法利用,而且无法度量.信息论中以互信息的方法来度量相关性(包括线性和非线性相关性),但实际算法中这需要大量的统计数据,无法适用于以说话人为样本的码本分量相关性计算.本文提出一种利用预测残差来度量随机变量相关性的方法,并给出分段预测相关指数和多项式预测相关指数两类相关性测度.在模拟数据上实验结果显示这种相关性的测度是合理而有效的.利用这两类相关性测度,我们详细地分析了码本状态间的相关性,讨论了线性相关性和非线性相关性的关系.结论表明,当两个状态是强相关时,非线性相关性可以忽略,因此,在快速自适应算法中从线性相关性入手是合理的.
语音识别 声学模型 自适应算法 码本状态间 相关性
余鹏 王作英
清华大学电子工程系语音实验室
国内会议
深圳
中文
273-276
2001-11-20(万方平台首次上网日期,不代表论文的发表时间)