一种基于时间集成神经网络的关键词检出技术
作为语音识别领域的核心热点技术之一,关键词检出技术(KWS)近年来得到了长足的发展。虽然目前在语音识别领域隐马尔可夫模型(HMM)占主导地位,但就关键词检出技术而言,人工神经网络(ANN),以出色的判别的能力,较小的计算量,更高的灵活度,成为重点研究的方向之一。本文提出将一种具有主副两个网络结构的新型神经网络──时间延迟集成网络(TANN)用于关键词检出,很好的解决了神经网络在处理时序分类问题上遭遇的困难,并且巧妙的回避了语音识别中的时间对正问题,并辅之以一种基于熵误差函数(EEF)的快速收敛且避免局部极小情况出现的网络训练算法。并通过初步实验证明这种网络在关键词检出上的性能表现与HMM相差无几,值得今后进行细致深入的研究。
时间延迟集成网络 熵误差反向传播算法 关键词检出 语音识别 隐马尔可夫模型
孙佳音 李海峰 王殿胜 韩纪庆
哈尔滨工业大学 计算机科学与技术学院 语音处理研究室,黑龙江哈尔滨150001
国内会议
北京
中文
136-140
2007-08-01(万方平台首次上网日期,不代表论文的发表时间)