会议专题

结合MLLR和MAP的说话人聚类自适应方法

本文提出一种改进的说话人聚类方法,同时结合最大似然线性回归法(MLLR)和最大后验概率法(MAP)构成整体的说话人自适应框架.传统的说话人聚类方法是在自适应前将训练集中说话人根据其声学特性分成若干类,并为每类分别构建模板,本文则根据新说话人的自适应数据动态地在训练集中选择与之最相近的训练人子集,构造出新的初始模型,将该方法应用于以音素为识别基元的汉语连续语音识别系统中,可有效的降低系统误识率,较好的满足快速性和渐进性.当提供5句自适应数据时,与基线系统相比音节误识率下降35.22﹪;当自适应数据增加到250句时,误识率下降50.74﹪.本文还同时进行了与MLLR、MAP等方法及SD模型的对比实验.

语音识别 最大似然线性回归法 最大后验概率法 自适应方法

徐琳 谢湘 匡镜明

北京理工大学电子工程系

国内会议

第七届全国人机语音通讯学术会议

厦门

中文

138-142

2003-11-01(万方平台首次上网日期,不代表论文的发表时间)