会议专题

基于多元信息和GMM的序贯判决话者识别

本文提出一种利用声源和声道信息、与文本无关的分级判决话者识别方法。系统选用长时平均基音周期、MFCC和AMFCC作为识别的特征参数,采用序贯判决思想,结合混合训练,以基音周期和MRCC的长时平均参数作为初判,以GMM参数模型作为细判,构成两级判决系统。实验表明,将声源和声道信息结合的序贯判决策略,使系统响应更快速、更可靠。混合训练可有效提高系统的环境鲁棒性。

说话人识别 混合训练 语音训练 多元信息 序贯判决 声道信息

田岚 侯正信 陆小珊

天津大学电子信息工程学院 天津 300072;山东大学信息科学与工程学院 济南 250100 天津大学电子信息工程学院 天津 300072 山东大学信息科学与工程学院 济南 250100

国内会议

第十三届全国青年通信学术会议

山东烟台

中文

1068-1072

2008-10-31(万方平台首次上网日期,不代表论文的发表时间)