基于参考说话人模型和双层结构的说话人辨认快速算法
为了提高基于高斯混合模型通用背景模型(GMM-UBM)的说话人辨认系统的运算效率, 本文提出了一种基于参考说话人模型的双层结构用于目标说话人剪枝,采用矢量量化方法从目标说话人模型集合中训练参考说话人模型,利用语音与参考说人模型的偏差来描述说话人的发音特性,将辨认语音偏差向量和目标说话人偏差向量的相似性作为距离度量进行目标说话人剪枝。实验结果表明: 在基于GMM-UBM的说话人辨认系统中,对包含5,200个目标说话人和1,000个集外说话人的测试集进行开集辨认的条件下,在提高辨认的运算效率12.5倍同时而识别率仅下降0.3%。
说话人辨认 语音识别 高斯模型 数理语言学
王刚 邬晓钧 郑方 王琳琳 张陈昊
清华信息科学技术国家实验室 技术创新与开发部 语音和语言技术中心,清华大学计算机科学与技术系,北京,100084
国内会议
西安
中文
1-5
2011-10-16(万方平台首次上网日期,不代表论文的发表时间)