会议专题

结合波束形成和GAN网络的多通道语音增强研究

后端滤波处理是多通道语音增强系统中一种比较常用的技术,其目的是为了进一步提高语音增强系统的性能,提高波束形成后的输出信噪比.但是,常用的后滤波方法需要相当繁琐的参数调整过程才能实现噪声抑制和语音质量之间的合理权衡.本文提出一种基于最小方差无畸变(MVDR)波束形成和生成对抗深层神经网络相结合的多通道语音增强算法.前端使用波束形成器对信号进行初步增强;后端滤波处理采用生成对抗深层神经网络,避免了繁琐的参数调整过程.实验系统是通过MATLAB和TensorFlow仿真实现,结果证明了该方法的有效性.

语音增强 波束形成 输出信噪比 生成对抗深层神经网络

余亮 吴海军 蒋伟康

上海交通大学 机械系统与振动国家重点实验室,上海 200240

国内会议

第二十八届全国振动与噪声高技术应用学术会议

上海

中文

591-596

2018-04-01(万方平台首次上网日期,不代表论文的发表时间)