广播语料的语音/音乐自动分割方法研究
本文介绍了两种对广播语料进行语音和音乐分割的建模策略基于GMM的竞争建模策略和区别性建模策略──的实现,这两种策略的建模都采用了MFCC系数作为输入信号的特征参数。通过对实际新闻广播语料的测试,表明这两种策略都能建立起有效地分割语音段和音乐段的分类模型;对于背景音乐和噪音较大的新闻语料,按照竞争建模策略构造的分类模型具有较好的语音/音乐分割性能。文章同时对不同的特征向量构造做了研究,实验表明12维的MFCC参数及其一阶差分、二阶差分能使按两种不同策略建立起来的分类模型都达到最好的语音/音乐分割效果。
语音信号处理 广播语料 语音分割 语料标注 高斯模型
崔文迪 蔡骏 黄关维
厦门大学,智能科学与技术系,厦门,361005 厦门大学,智能科学与技术系,厦门,361005 Groupe Parole,LORIA-CNRS & INRIA,BP 239,54600 Vandoeuvre-les-Nancy,France
国内会议
哈尔滨
中文
1165-1170
2007-11-20(万方平台首次上网日期,不代表论文的发表时间)