基于Gmm和VOT的音素发音错误检测

摘要：

　　本文基于高斯混合模型（GMM）和嗓音起始时间（VOT）的普通话音素发音错误检测，提出了一种结合语音声道特征信息和音源特征信息的发音错误检测方法。其中GMM用于反映声道特征信息的MFCC参数的建模与评测，并直接对大部分音素的发音质量直接进行错误检测。对于少数通过MFCC参数和GMM难于检测区分的辅音音素，则通过反映VOT信息的音源特征参数进行区分。实验表明，该方法在训练数据有限的情况下取得了较好的性能，非常适合用于聋人语言康复的计算机辅助训练。

关键词：语音识别音素检测高斯模型仪器语音学

作者: 刘明辉黄中伟

作者单位: 深圳大学语音实验室,深圳 518060

会议类型: 国内会议

会议名称: 第十一届全国人机语音通讯学术会议

会议地点: 西安

会议语种:中文

页码: 1-4

在线出版日期: 2011-10-16（万方平台首次上网日期，不代表论文的发表时间）

会议专题

基于Gmm和VOT的音素发音错误检测