会议专题

基于多置信特征融合语音识别拒识算法的设计与实现

  在语音识别实际应用系统中,用户输入语音中不可避免的带有非法声响(如停顿、咳嗽声以及环境噪声等)或词库外语音,给语音识别的稳健性带来了巨大挑战,因此需要相应拒识算法来提高识别性能。本文通过研究语音识别中经典拒识算法,结合反映识别网络局部信息的在线垃圾模型、音素置信度和反映识别网络整体特征的N-best结果信息这三种不同方面的特征信息,提出了一种基于多置信特征融合的拒识算法,并且利用多置信特征能在多个角度考察输入语音的优势,实验验证本文提出的多置信特征有效提高了拒识效果。

语音识别 背景噪音 拒识算法 数理语言学

牛建伟 谢磊 路晓明 周祥增 张艳宁

西北工业大学 计算机学院,陕西省语音与图像信息处理重点实验室,西安 710129

国内会议

第十一届全国人机语音通讯学术会议

西安

中文

1-4

2011-10-16(万方平台首次上网日期,不代表论文的发表时间)