基于支持向量机与多观测复合特征矢量的语音端点检测
本文提出了一种新的多观测复合特征(MO-CF)用于基于支持向量机(SVM)的语音端点检测(VAD)。该特征是由2个子特征经平衡因子加权构成。特征的优化目标是寻找能使VAD的性能曲线下面积(AUC)最大化的平衡因子,以综合各 个子特征的优点。在子特征选择方面,要求各个子特征不仅本身具有较好的性能,而且存在互补性。针对该要求,提出2种组合特征MO-CF1和MO-CF2。由多观测信噪比(MO-SNR) 特征与多观测最大概率(MO-MP)特征复合而成的MO-CF2比 MO-CF1更稳健。实验结果表明:在多种噪声环境下,相比于已有的9种VAD算法,该算法具有更好的性能和更高的稳健性。
语音信号 信号处理 端点检测 支持向量机
张晓雷 吴及 吕萍
清华大学 电子工程系,北京 100084
国内会议
西安
中文
1-5
2011-10-16(万方平台首次上网日期,不代表论文的发表时间)