基于分层结构的文本相关说话人识别算法

摘要：

　　本文提出了一种基于分层结构的文本相关说话人识别算法。该算法首先建立一个UBM模型，然后用一段说话人的长语音从UBM中自适应一个文本无关的GMM模型，再用多段说话人的短口令语音从GMM模型中自适应一个SCHMM模型，由GMM模型和SCHMM模型共同组成一个文本相关的说话人模型。该算法有效利用了大量背景语料所涵盖的背景知识，克服了DTW和HMM等算法的缺点，建立了一个鲁棒性更强的说话人模型，并初步研究了判决阈值的设置问题。在自建电话语音库TS_Corpus上获得了4.6％的等错误率，较DTW和HMM分别降低了80%和86.8%，验证了该算法的有效性。

关键词：语音识别文本结构高斯模型数理语言学

作者: 李稀敏洪青阳黄晓丹

作者单位: 厦门大学智能科学与技术系,厦门 361005

会议类型: 国内会议

会议名称: 第十一届全国人机语音通讯学术会议

会议地点: 西安

会议语种:中文

页码: 1-4

在线出版日期: 2011-10-16（万方平台首次上网日期，不代表论文的发表时间）

会议专题

基于分层结构的文本相关说话人识别算法