基于分层结构的文本相关说话人识别算法
本文提出了一种基于分层结构的文本相关说话人识别算法。该算法首先建立一个UBM模型,然后用一段说话人的 长语音从UBM中自适应一个文本无关的GMM模型,再用多段说话人的短口令语音从GMM模型中自适应一个SCHMM模型,由GMM模型和SCHMM模型共同组成一个文本相关的说话人模型。该算法有效利用了大量背景语料所涵盖的背景知识,克服了DTW和HMM等算法的缺点,建立了一个鲁棒性更强的说话人模型,并初步研究了判决阈值的设置问题。在自建电话语音库TS_Corpus上获得了4.6%的等错误率,较DTW和HMM分别降低了80%和86.8%,验证了该算法的有效性。
语音识别 文本结构 高斯模型 数理语言学
李稀敏 洪青阳 黄晓丹
厦门大学 智能科学与技术系,厦门 361005
国内会议
西安
中文
1-4
2011-10-16(万方平台首次上网日期,不代表论文的发表时间)