会议专题

基于非负矩阵分解和向量相似测度的语音与音乐分离算法

  本文针对语音和音乐混叠信号提出一种基于非负矩阵分解(NMF)和向量相似性测度的半盲源分离算法。通过对纯音乐片断进行NMF获得音乐频谱在分解矢量空间的分布(即信号NMF后的基本矩阵),并将其作为先验知识用于混叠信 号NMF分量的分离。采用向量夹角余弦来测量混叠信号NMF分量与训练音乐NMF分量之间的相似性,并根据相似测度对NMF各分量进行语音/音乐属性判定。实验结果表明,相对于基于各类限制条件的NMF分离算法,本算法在信噪比、语音质量听觉评价等指标上都有较显著的改善。

语音信号 信号处理 半盲源分离 数理语言学

郑能恒 蔡毅 李霞 Tan Lee

深圳大学信息工程学院,深圳 518060 香港中文大学电子工程系, 香港沙田

国内会议

第十一届全国人机语音通讯学术会议

西安

中文

1-5

2011-10-16(万方平台首次上网日期,不代表论文的发表时间)