基于谱熵的电话语音/非语音识别
基于电话的自动语音应答系统或说话人识别系统需要将实际的说话人语音与其他的非语音信息区分开。区分电话语音和非语音是一个有挑战性的问题。本文提出计算声音信号帧间谱熵的相似度,由此区分电话语音和非语音的方法。在对41个电话非语音信号段和包含11个说话人的914个语音信号段(段长200-700ms)的检测中,本文得到几乎100%的正确识别率。方法简单,效果好,这是本文提出方法的优点。
语音识别 谱熵 相似度 信号处理
Guiwen Ou 欧贵文
Department of computer Science,Zhongshan University Guangzhou 510275 中山大学计算机科学系,广州,510275
国内会议
厦门
中文
171-175
2006-07-25(万方平台首次上网日期,不代表论文的发表时间)