早期反射声对因果去混响网络的重要性研究
深度神经网络去混响算法是单通道语音增强领域的研究热点,包括非因果网络和因果网络。相较于非因果网络,因果深度神经网络去混响算法存在严重的相位不连续问题,影响主观听感。为了解决这一问题,研究了以保留不同时长早期反射声作为训练目标的因果深度神经网络去混响算法的性能。实验结果表明,相比于以直达声作为训练目标,保留部分早期反射声作为训练目标可有效改善因果深度神经网络去混响算法中的相位不连续问题。所提方法在DNSMOS 得分及SRMR 得分均显著提高,非正式主观测听结果中也表现出更优的语音质量及听感。
语音去混响 深度学习 因果系统 语音质量
罗笑雪 郑成诗 柯雨璇 李晓东
中国科学院声学研究所噪声与振动重点实验室,北京 100190;中国科学院大学,北京 100049
国内会议
重庆
中文
342-347
2022-04-10(万方平台首次上网日期,不代表论文的发表时间)