口语障碍者的语音特征分析与变换

摘要：

声音变换技术在语音识别、语音合成、保密通信等领域都有广泛的潜在应用前景.本文将研究如何将不同程度口语障碍者的语音,通过分析和变换转换成另一种更易于听懂的语音.在分析中,我们用线谱频率(LSF)作为参数,用混合高斯模型(GMM)为源说话人(口语障碍者)和目的说话人(正常人)的声学特征建立模型,通过EM算法对模型进行优化.同时,源说话人与目的说话人的特征转换矩阵在线性最小均方误差(LMMSE)准则下得到.实验表明,该变换能将源说话人的LPC谱转换成接近目的说话人的LPC谱.另外,XAB听力测试表明,转换后的语音75﹪被正确地辨别为目的语音.

关键词：口语障碍者语音特征混合高斯模型语音合成

作者: 张建平潘接林韩疆颜永红

作者单位: 中国科学院声学研究所中科信利语音实验室

会议类型: 国内会议

会议名称: 第六届全国现代语音学学术会议

会议地点: 天津

会议语种:中文

页码: 104-108

在线出版日期: 2003-10-01（万方平台首次上网日期，不代表论文的发表时间）

会议专题

口语障碍者的语音特征分析与变换