基于分数规整的发音方式鲁棒的说话人识别研究
实际环境下,一个说话人识别系统的性能受到很多因素的影响,说话人自身发音方式的变化所引起的训练与识别语音的不匹配是其中很重要的一个方面。本文以一个含有多种发音方式变化的数据库为基础,对于不限定发音方式变化类型的情形,在分数域提出了一系列发音方式分数规整(S-Norm)的解决方法。实验结果表明,SZ-Norm、ST-Norm及SZT-Norm的做法均使系统的整体性能在基线基础上有了明显提高,尤其是在SZT-Norm的情况下等错误率下降约为26”%”,这说明基于分数规整的方法是有效的。
说话人识别 鲁棒性 发音方式 分数规整 SZT-Norm
王琳琳 张利鹏 徐明星
清华大学计算机科学与技术系 智能技术与系统国家重点实验室 清华信息科学技术国家实验室,北京 100084
国内会议
乌鲁木齐
中文
285-289
2009-08-14(万方平台首次上网日期,不代表论文的发表时间)