会议专题

语音识别码本状态间的线性和非线性相关性

目前很多语音识别的快速自适应算法都把最大限度地利用声学模型(码本)参数的先验信息作为主要手段,尤其是码本状态间的相关性,在这类自适应算法中用得非常普遍.由于自适应算法对于数据和时间的需要,这类算法往往只能利用状态间的线性相关性,对于非线性相关性,则不但无法利用,而且无法度量.信息论中以互信息的方法来度量相关性(包括线性和非线性相关性),但实际算法中这需要大量的统计数据,无法适用于以说话人为样本的码本分量相关性计算.本文提出一种利用预测残差来度量随机变量相关性的方法,并给出分段预测相关指数和多项式预测相关指数两类相关性测度.在模拟数据上实验结果显示这种相关性的测度是合理而有效的.利用这两类相关性测度,我们详细地分析了码本状态间的相关性,讨论了线性相关性和非线性相关性的关系.结论表明,当两个状态是强相关时,非线性相关性可以忽略,因此,在快速自适应算法中从线性相关性入手是合理的.

语音识别 声学模型 自适应算法 码本状态间 相关性

余鹏 王作英

清华大学电子工程系语音实验室

国内会议

第六届全国人机语音通讯学术会议

深圳

中文

273-276

2001-11-20(万方平台首次上网日期,不代表论文的发表时间)