结合波束形成和GAN网络的多通道语音增强研究
后端滤波处理是多通道语音增强系统中一种比较常用的技术,其目的是为了进一步提高语音增强系统的性能,提高波束形成后的输出信噪比.但是,常用的后滤波方法需要相当繁琐的参数调整过程才能实现噪声抑制和语音质量之间的合理权衡.本文提出一种基于最小方差无畸变(MVDR)波束形成和生成对抗深层神经网络相结合的多通道语音增强算法.前端使用波束形成器对信号进行初步增强;后端滤波处理采用生成对抗深层神经网络,避免了繁琐的参数调整过程.实验系统是通过MATLAB和TensorFlow仿真实现,结果证明了该方法的有效性.
语音增强 波束形成 输出信噪比 生成对抗深层神经网络
余亮 吴海军 蒋伟康
上海交通大学 机械系统与振动国家重点实验室,上海 200240
国内会议
上海
中文
591-596
2018-04-01(万方平台首次上网日期,不代表论文的发表时间)