口语障碍者的语音特征分析与变换
声音变换技术在语音识别、语音合成、保密通信等领域都有广泛的潜在应用前景.本文将研究如何将不同程度口语障碍者的语音,通过分析和变换转换成另一种更易于听懂的语音.在分析中,我们用线谱频率(LSF)作为参数,用混合高斯模型(GMM)为源说话人(口语障碍者)和目的说话人(正常人)的声学特征建立模型,通过EM算法对模型进行优化.同时,源说话人与目的说话人的特征转换矩阵在线性最小均方误差(LMMSE)准则下得到.实验表明,该变换能将源说话人的LPC谱转换成接近目的说话人的LPC谱.另外,XAB听力测试表明,转换后的语音75﹪被正确地辨别为目的语音.
口语障碍者 语音特征 混合高斯模型 语音合成
张建平 潘接林 韩疆 颜永红
中国科学院声学研究所中科信利语音实验室
国内会议
天津
中文
104-108
2003-10-01(万方平台首次上网日期,不代表论文的发表时间)