会议专题

口语障碍者的语音特征分析与变换

声音变换技术在语音识别、语音合成、保密通信等领域都有广泛的潜在应用前景.本文将研究如何将不同程度口语障碍者的语音,通过分析和变换转换成另一种更易于听懂的语音.在分析中,我们用线谱频率(LSF)作为参数,用混合高斯模型(GMM)为源说话人(口语障碍者)和目的说话人(正常人)的声学特征建立模型,通过EM算法对模型进行优化.同时,源说话人与目的说话人的特征转换矩阵在线性最小均方误差(LMMSE)准则下得到.实验表明,该变换能将源说话人的LPC谱转换成接近目的说话人的LPC谱.另外,XAB听力测试表明,转换后的语音75﹪被正确地辨别为目的语音.

口语障碍者 语音特征 混合高斯模型 语音合成

张建平 潘接林 韩疆 颜永红

中国科学院声学研究所中科信利语音实验室

国内会议

第六届全国现代语音学学术会议

天津

中文

104-108

2003-10-01(万方平台首次上网日期,不代表论文的发表时间)