小资源下基于神经网络的声学建模
小资源条件是指用于搭建语音识别系统的训练数据受限的情况.在该情况下,声学建模的精度亦受到影响.本文主要研究了小资源条件下神经网络声学模型的选择问题,重点对比了p-norm DNN(Deep Neural Networks)模型和长短时记忆(Long Short-Term Memory,LSTM)模型.在英文Switchboard测试集上,与传统的混合高斯-隐马尔科夫模型(Gaussian Mixture Model-Hidden Markov Model,GMM-HMM)相比,p-norm DNN模型和LSTM模型在数据充足的情况均取得了明显改进.而在小资源条件下,p-norm DNN模型取得了最优的结果.
语音识别 声学建模 神经网络 小资源条件
杨晋仪 张鹏远 潘接林 颜永红
中国科学院声学研究所语言声学与内容理解重点实验室,北京 100190
国内会议
西安
中文
408-411
2015-10-15(万方平台首次上网日期,不代表论文的发表时间)