关于外周听觉模型中语音信号处理的分帧问题

摘要：

在传统的语音识别系统的前端处理中，基于语音信号的短时平稳特性，对输入的语音信号采取分帧处理的方法。由于听觉系统在对语音信号处理过程中，利用并保持了语音信号的连续性和动态性。因此在进行听觉建模工作中，分帧的处理方法是否同样适用？该文在计算听觉模型的前端处理中，针对不分帧策略和传统分帧策略哪一种更适合后续处理和提高系统的整体识别性能这一问题，进行了探讨。实验结果表明：在低信噪比情况下，不分帧处理的鲁棒性大大优于分帧处理；在高信噪比情况下，分帧处理的识别结果优于不分帧处理的结果。

关键词：听觉外周模型分帧处理方法不分帧处理方法语音识别

作者: 刘志敏吴玺宏甄斌迟惠生

作者单位: 大学视觉与听觉信息处理实验室

会议类型: 国内会议

会议名称: 1999年中国神经网络与信号处理学术会议

会议地点: 汕头

会议语种:中文

页码: 401～404

在线出版日期: 1999-11-01（万方平台首次上网日期，不代表论文的发表时间）

会议专题

关于外周听觉模型中语音信号处理的分帧问题