基于CQT的多维音乐旋律模型的研究
目前,对于AUDIO的音乐信息检索(MIR)主要是利用音色、节拍等信息而避开了音高旋律轮廓信息.为了明确描述表示MP3音高内容的特征向量,本文设计了几组听感旋律相似的数据库,完成了对多维特征参数的组合分析;利用支持向量机(SVM)对六类不同地域民乐的相似旋律数据库进行了分类研究。分类实验结果表明,利用36维CQT值构成的音高向量,六类民乐分类的准确率可以达到98.15%;前5维MFCC对相似旋律音乐的分类贡献率与CQT的贡献率之比为0.1.因此,36维CQT值构成的音高向量模型可以很好的表示MP3音乐的音高旋律,对于旋律相似的Audio音乐数据具有很好的分类效果。
音乐信息检索 多维音乐旋律模型 感知分析 CQT值 特征向量模型
许洁萍 赵阳 刘怡
中国人民大学信息学院计算机系,北京 100872
国内会议
第二届和谐人机环境联合(第15届全国多媒体技术、第2届全国人机交互、第2届全国普适计算)学术会议
杭州
中文
414-421
2006-10-31(万方平台首次上网日期,不代表论文的发表时间)