基于SVM多类分类框架的语音和非语音分类方法
语音和非语音分类的问题属于音频场景分类研究的范畴.国内外对音频场景分类进行了广泛深入的研究,针对不同的分类任务,也采用了不同的分类器”1””2”.Lie Lu”1”和姜洪臣”3”等人引入了支持向量机(SVM)两类分类器,并采用了基于音频类型二叉树的多级分类框架实现了音频信号的多类分类,该框架首先将音频信号划分为静音和非静音,然后再把非静音划分为语音和非语音,其中语音又分为纯语音和非纯语音,非语音又分为音乐和环境音.本文反其道而行之,利用SVM的多类分类框架,来提高基于SVM的语音和非语音两类音频分类的性能.
SVM 分类框架 语音分类 音频场景
浦剑涛 王辉 姜洪臣 徐波
中国科学院,自动化研究所,高技术创新中心,北京,100080 北京机械工业学院,计算机与自动化系,北京,100080
国内会议
厦门
中文
395-396
2006-10-01(万方平台首次上网日期,不代表论文的发表时间)