会议专题

与文本无关说话人识别系统的性能比较

用语音来鉴别说话人身份有许多独特的优点,如语音是人的固有特征,不会丢失或遗忘;语音信号采集方便,系统设备成本低等,因此自动说话人识别具有广泛的应用前景.本文以语音信号的LPC倒谱系数、差值倒谱系数、基音周期和差值基音周期的混合特征参数作为识别的特征矢量集,比较了利用矢量量化(VQ)、各态经历隐马尔可夫模型(HMM)、混合高斯分布模型(GMM)技术实现的与文本无关说话人识别系统的性能.结论是GMM性能最好,最高识别率可达93.6﹪,其次是各态经历HMM,而VQ最差,其最高识别率仅为86.2﹪.

语音信号采集 自动说话人识别 LPC倒谱系数 差值倒谱系数 基音周期 差值基音周期 矢量量化 隐马尔可夫模型 混合高斯分布模型 与文本无关说话人识别系统

刘大力 赵力

东南大学学习科学研究中心(南京)

国内会议

2004全国物理声学会议

镇江

中文

105-106

2004-10-01(万方平台首次上网日期,不代表论文的发表时间)