会议专题

基于谱熵的电话语音/非语音识别

  基于电话的自动语音应答系统或说话人识别系统需要将实际的说话人语音与其他的非语音信息区分开。区分电话语音和非语音是一个有挑战性的问题。本文提出计算声音信号帧间谱熵的相似度,由此区分电话语音和非语音的方法。在对41个电话非语音信号段和包含11个说话人的914个语音信号段(段长200-700ms)的检测中,本文得到几乎100%的正确识别率。方法简单,效果好,这是本文提出方法的优点。

语音识别 谱熵 相似度 信号处理

Guiwen Ou 欧贵文

Department of computer Science,Zhongshan University Guangzhou 510275 中山大学计算机科学系,广州,510275

国内会议

第17届全国计算机新科技与计算机教育学术大会

厦门

中文

171-175

2006-07-25(万方平台首次上网日期,不代表论文的发表时间)