结合波束形成和GAN网络的多通道语音增强研究

摘要：

后端滤波处理是多通道语音增强系统中一种比较常用的技术,其目的是为了进一步提高语音增强系统的性能,提高波束形成后的输出信噪比.但是,常用的后滤波方法需要相当繁琐的参数调整过程才能实现噪声抑制和语音质量之间的合理权衡.本文提出一种基于最小方差无畸变(MVDR)波束形成和生成对抗深层神经网络相结合的多通道语音增强算法.前端使用波束形成器对信号进行初步增强;后端滤波处理采用生成对抗深层神经网络,避免了繁琐的参数调整过程.实验系统是通过MATLAB和TensorFlow仿真实现,结果证明了该方法的有效性.

关键词：语音增强波束形成输出信噪比生成对抗深层神经网络

作者: 余亮吴海军蒋伟康

作者单位: 上海交通大学机械系统与振动国家重点实验室,上海 200240

会议类型: 国内会议

会议名称: 第二十八届全国振动与噪声高技术应用学术会议

会议地点: 上海

会议语种:中文

页码: 591-596

在线出版日期: 2018-04-01（万方平台首次上网日期，不代表论文的发表时间）

会议专题

结合波束形成和GAN网络的多通道语音增强研究