会议专题

基于CQT的多维音乐旋律模型的研究

目前,对于AUDIO的音乐信息检索(MIR)主要是利用音色、节拍等信息而避开了音高旋律轮廓信息.为了明确描述表示MP3音高内容的特征向量,本文设计了几组听感旋律相似的数据库,完成了对多维特征参数的组合分析;利用支持向量机(SVM)对六类不同地域民乐的相似旋律数据库进行了分类研究。分类实验结果表明,利用36维CQT值构成的音高向量,六类民乐分类的准确率可以达到98.15%;前5维MFCC对相似旋律音乐的分类贡献率与CQT的贡献率之比为0.1.因此,36维CQT值构成的音高向量模型可以很好的表示MP3音乐的音高旋律,对于旋律相似的Audio音乐数据具有很好的分类效果。

音乐信息检索 多维音乐旋律模型 感知分析 CQT值 特征向量模型

许洁萍 赵阳 刘怡

中国人民大学信息学院计算机系,北京 100872

国内会议

第二届和谐人机环境联合(第15届全国多媒体技术、第2届全国人机交互、第2届全国普适计算)学术会议

杭州

中文

414-421

2006-10-31(万方平台首次上网日期,不代表论文的发表时间)