基于Gmm和VOT的音素发音错误检测

本文基于高斯混合模型(GMM)和嗓音起始时间(VOT)的普通话音素发音错误检测,提出了一种结合语音声道特征信息和音源特征信息的发音错误检测方法。其中GMM用于反映声道特征信息的MFCC参数的建模与评测,并直接对大部分音素的发音质量直接进行错误检测。对于少数通过MFCC参数和GMM难于检测区分的辅音音素,则通过反映VOT信息的音源特征参数进行区分。实验表明,该方法在训练数据有限的情况下取得了较好的性能,非常适合用于聋人语言康复的计算机辅助训练。
语音识别 音素检测 高斯模型 仪器语音学
刘明辉 黄中伟
深圳大学语音实验室,深圳 518060
国内会议
西安
中文
1-4
2011-10-16(万方平台首次上网日期,不代表论文的发表时间)