一种噪声谱估计的快速跟踪算法
噪声谱估计是对带噪语音进行语音增强的重要部分.传统的噪声谱估计算法基于语音端点检测(Voice Activity Detectors:VADs)”1”,噪声只在无声段或语音的间歇段进行更新.但是,低信噪比,语音端点检测不准确,容易将清音和弱语音误判为无声段.90年代,出现了基于语音出现概率的噪声谱估计算法并得到应用”2”.Martin提出基于最小统计特性(Minimum Statistics method:MS)噪声谱估计算法”3”,后来,Martin从理论上完善了这种噪声谱估计算法”4”.Cohen”5”提出的IMCRA(Improved Minima Controlled Recursive Average)噪声谱估计算法,解决了噪声谱缓慢增大(噪声谱以不大于2dB/s速度增大)的噪声跟踪问题. 基于VAD的噪声更新算法,如果噪声在语音段的特性发生改变,噪声将不能得到及时更新;采用基于语音出现概率的方法,噪声估计的准确性依赖于语音出现概率p(k,l);MS噪声谱估计算法,噪声更新延迟较大,达到1~1.5 秒,而且噪声谱估计方差较大,不可忽略.Cohen”5”提出的IMCRA噪声谱估计算法,仅用MS噪声谱估计算法确定语音出现的概率p(k,l),这种算法噪声谱估计方差不会增大.IMCRA噪声谱估计算法受到MS噪声谱估计算法的约束,同样具有噪声更新延迟问题.实验表明:对于突变噪声,IMCRA噪声谱估计算法跟踪噪声的延迟是MS噪声谱估计算法的两倍. 本文采用MS噪声谱估计算法,并补偿MS噪声谱估计算法估计的均值,使MS噪声谱估计趋近无偏估计,以此估算语音出现概率p(k,l),最终实现了噪声谱估计的快速跟踪算法.
噪声谱估计 快速跟踪算法 带噪语音 语音增强
郑成诗 李晓东 莫福源 田静
中国科学院声学研究所,北京,100080
国内会议
厦门
中文
401-402
2006-10-01(万方平台首次上网日期,不代表论文的发表时间)