语种识别和说话人识别的关键技术研究
本文对语种识别和说话人识别的关键技术进行了深入研究.语种识别采用基于声学特征的识别方法,提取了美尔综合倒谱(MGCEP)声学特征;用特征组织变换SDF(shift delta feature)加强了音素之间的相互关联性;语种识别率可以达到93%以上.说话人识别采用了多特征多模型构架,特征使用了线性预测倒谱(LPCCEP)、对数面积比(LAR)和听觉感知参数(PSP);模型采用了矢量量化(VQ)和高斯混合密度模型(GMM);运用信息融合方法进行综合判决,整体性能较单特征单模型方法有较大提高.说话人识别准确率可以达到95%以上.
语音识别 语种识别 说话人识别 特征提取 信息融合
董林 田家斌 刘辉新 刘倩
国内会议
武汉
中文
1213-1215
2006-10-01(万方平台首次上网日期,不代表论文的发表时间)