基于BLSTM的语音识别解码优化算法
为了降低基于BLSTM的语音识别系统的实时率。本文在CSC-Chunk算法的基础上,使用上一个Chunk结束帧的BLSTM-Cell状态来初始化下一个Chunk起始帧的BLSTM-Cell,从而节省了CSC-Chunk左上文扩展带来的计算开销。实验表明,该方法能够在精度不损失的情况下取得0.3~0.4倍的加速。
语音识别 声学建模 解码算法 双向长短时记忆神经网络
邬龙 黎塔 王丽 颜永红
中国科学院声学研究所 语言声学与内容理解重点实验室,北京100190;中国科学院大学,北京100049 中国科学院声学研究所 语言声学与内容理解重点实验室,北京100190 中国科学院声学研究所 语言声学与内容理解重点实验室,北京100190;中国科学院大学,北京100049;中国科学院新疆理化技术研究所 新疆民族语音语言信息处理实验室,新疆乌鲁木齐 830011
国内会议
哈尔滨
中文
659-660
2017-09-22(万方平台首次上网日期,不代表论文的发表时间)