电视背景环境下语音命令识别系统
设计了一种电视背景环境下的非特定人语音控制命令识别系统,包括基于隐马尔可夫模型的孤立词识别子系统和基于扩展信息最大化(Infomax)独立成分分析算法的语音分离子系统。本语音识别系统的语音库包括8 400个电视机转台控制命令的语音数据。在无噪环境下对特定语音命令的识别率可达93.2%,正常电视背景环境下的识别率降至49.0%,对电视背景下通过分离后的语音命令识别率可达85.8%。
电视背景 语音命令识别 隐马尔可夫模型 独立成分分析 扩展信息最大化
范婷 刘宏
西安电子科技大学电子工程学院,陕西西安 710126 北京大学深圳研究生院信息工程学院,广东深圳 518055
国内会议
深圳
中文
312-315
2011-11-11(万方平台首次上网日期,不代表论文的发表时间)