说话人识别系统研究与实现
说话人识别(Speaker Recognition),又称声纹识别(Voiceprint Recognition),是由计算机利用语音波形中所包含的反映特定说话人生理和行为特征的语音特征参数来自动识别说话人身份的技术。在算法方面提出了一个高性能语音身份识别系统模型。该系统采用MFCC参数和文本无关的高斯混合模型(GMM)为语音的声学模型,并以最大后验概率(MAP)算法进行模型的训练并实现最终的模型匹配。
说话人识别 MFCC参数 高斯混合模型 最大后验概率算法
张晶 董金明 冯文全
北京航空航天大学 电子信息工程学院,北京 100091
国内会议
南宁
中文
594-597
2008-10-01(万方平台首次上网日期,不代表论文的发表时间)