早期反射声对因果去混响网络的重要性研究

摘要：

　　深度神经网络去混响算法是单通道语音增强领域的研究热点，包括非因果网络和因果网络。相较于非因果网络，因果深度神经网络去混响算法存在严重的相位不连续问题，影响主观听感。为了解决这一问题，研究了以保留不同时长早期反射声作为训练目标的因果深度神经网络去混响算法的性能。实验结果表明，相比于以直达声作为训练目标，保留部分早期反射声作为训练目标可有效改善因果深度神经网络去混响算法中的相位不连续问题。所提方法在DNSMOS 得分及SRMR 得分均显著提高，非正式主观测听结果中也表现出更优的语音质量及听感。

关键词：语音去混响深度学习因果系统语音质量

作者: 罗笑雪郑成诗柯雨璇李晓东

作者单位: 中国科学院声学研究所噪声与振动重点实验室,北京 100190;中国科学院大学,北京 100049

会议类型: 国内会议

会议名称: 第十五届全国信号和智能信息处理与应用学术会议

会议地点: 重庆

会议语种:中文

页码: 342-347

在线出版日期: 2022-04-10（万方平台首次上网日期，不代表论文的发表时间）

会议专题

早期反射声对因果去混响网络的重要性研究