基于GMM-UBM的稳健说话人识别系统

摘要：

本文介绍了一种基于MFCC倒谱特征和GMM-UBM模型的稳健说话人识别系统，旨在基于当前主流技术的基础上进一步改进系统识别率和噪声鲁棒性，因此本文仅对低层次的声学特征进行提取和建模，并对系统的前端处理进行了如下改进：提出基于子带能量和基频检测的语音检测算法；使用CMVN特征归一化方法提高MFCC倒谱特征的抗噪声干扰性能；证明了对数能量特征在说话人识别系统中的无效性；探讨了SDC动态特征在说话人识别系统中的应用。在 NIST的说话人验证评估集上进行了测试，改进后的系统的错误率比基线系统降低了约26％。

关键词：语音识别语音处理说话人识别系统

作者: 浦剑涛郑榕姜洪臣徐波

作者单位: 中国科学院自动化研究所高技术创新中心，北京，100080

会议类型: 国内会议

会议名称: 第九届全国人机语言通讯学术会议

会议地点: 安徽黄山

会议语种:中文

在线出版日期: 2007-10-21（万方平台首次上网日期，不代表论文的发表时间）

会议专题

基于GMM-UBM的稳健说话人识别系统