会议专题

发音人确认系统前端改进的实验研究

本文对发音人确认系统前端的改进进行了实验研究。考察了语音波形中无声段对系统性能的影响,实验结果表明:在剔除无声段之后,EER(Equal Error Rate)值相对下降50%。又考察了清/浊音段对系统性能的影响,剔除清声段,仅利用浊音段进行训练、测试,EER值相对下降20%。为了克服测试环境与训练环境不匹配带来的系统性能下降,我们实验了谱减和倒谱均值减两种语音增强算法。综合运用这两种方法,可以使系统的EER 值相对下降20%以上。此外在GMM训练过程,还采用二叉树分类用以估计GMM初始参数,解决了混合数增加引起的计算量增加及聚类样本稀疏问题。

发音人确认系统 无声段 浊音段 倒谱均值减 系统性能

李丹丹 朱维彬 邓锐 都大龙 刘洛麒 刘迪伟

北京交通大学,计算机与信息技术学院,北京,100044

国内会议

第九届全国人机语言通讯学术会议

安徽黄山

中文

2007-10-21(万方平台首次上网日期,不代表论文的发表时间)