会议专题

基于高斯混合模型流行音乐中歌唱部分的智能检测

有效地检测出流行音乐中的歌唱部分对在海量数据库中进行音乐检索、浏览、归类,以及旋律提取和歌唱家识别等有较大的价值.本文使用在语音信号处理中广泛使用的基于梅尔频率的倒谱系数(MFCC)作为语音特征来分析所要处理的音乐信号,并采用高斯混合模型(GMM)的建模方法分别为音乐中的伴奏部分(non-vocal)和歌唱部分(vocal)建立相应的GMM,进而实现音乐中歌唱部分的智能检测.与传统的只用一组手工标示了vocal和non-vocal的训练数据分别为两类数据训练一个GMM的方法相比较,本文在此基础上,再分别用一组纯歌唱部分数据和一组纯伴奏部分数据为每类建立一个GMM,然后将上述得到的两个vocalGMMs和non-vocalGMMs进行线性组合得到表示每类的概率模型.本文使用似然概率分类器作为系统的决策函数.实验结果表明该方法能够有效提高系统的识别性能.

歌唱部分 智能检测 伴奏部分 高斯混合模型 梅尔频率 倒谱系数 海量数据库 音乐检索

李丽娟 叶茂 赵欣

电子科技大学,计算机科学与工程学院,四川,成都,610054

国内会议

第二届全国智能信息处理学术会议

徐州

中文

1017-1020

2009-05-01(万方平台首次上网日期,不代表论文的发表时间)