会议专题

基于分层结构的文本相关说话人识别算法

  本文提出了一种基于分层结构的文本相关说话人识别算法。该算法首先建立一个UBM模型,然后用一段说话人的 长语音从UBM中自适应一个文本无关的GMM模型,再用多段说话人的短口令语音从GMM模型中自适应一个SCHMM模型,由GMM模型和SCHMM模型共同组成一个文本相关的说话人模型。该算法有效利用了大量背景语料所涵盖的背景知识,克服了DTW和HMM等算法的缺点,建立了一个鲁棒性更强的说话人模型,并初步研究了判决阈值的设置问题。在自建电话语音库TS_Corpus上获得了4.6%的等错误率,较DTW和HMM分别降低了80%和86.8%,验证了该算法的有效性。

语音识别 文本结构 高斯模型 数理语言学

李稀敏 洪青阳 黄晓丹

厦门大学 智能科学与技术系,厦门 361005

国内会议

第十一届全国人机语音通讯学术会议

西安

中文

1-4

2011-10-16(万方平台首次上网日期,不代表论文的发表时间)