会议专题

一种基于时间集成神经网络的关键词检出技术

作为语音识别领域的核心热点技术之一,关键词检出技术(KWS)近年来得到了长足的发展。虽然目前在语音识别领域隐马尔可夫模型(HMM)占主导地位,但就关键词检出技术而言,人工神经网络(ANN),以出色的判别的能力,较小的计算量,更高的灵活度,成为重点研究的方向之一。本文提出将一种具有主副两个网络结构的新型神经网络──时间延迟集成网络(TANN)用于关键词检出,很好的解决了神经网络在处理时序分类问题上遭遇的困难,并且巧妙的回避了语音识别中的时间对正问题,并辅之以一种基于熵误差函数(EEF)的快速收敛且避免局部极小情况出现的网络训练算法。并通过初步实验证明这种网络在关键词检出上的性能表现与HMM相差无几,值得今后进行细致深入的研究。

时间延迟集成网络 熵误差反向传播算法 关键词检出 语音识别 隐马尔可夫模型

孙佳音 李海峰 王殿胜 韩纪庆

哈尔滨工业大学 计算机科学与技术学院 语音处理研究室,黑龙江哈尔滨150001

国内会议

第十三届全国信号处理学术年会

北京

中文

136-140

2007-08-01(万方平台首次上网日期,不代表论文的发表时间)