会议专题

高维倒谱参数在非特定人声调识别中的应用

语音识别技术在手持式设备中最普遍的应用当数特定人语音拨号系统,但其繁琐的训练过程往往令用户望而生畏.相比较而言,非特定人语音识别技术的优越性显而易见,最有吸引力的一点就是无需训练,即买即用.对于非特写人汉语语音识别而言,如何处理四声是一个不可忽视的问题,因为声调是汉语与西方语言最大的区别.以前我们曾经针对特写人语音拨号系统作过声调识别的研究,并取得了令人满意的结果.在向非特写人过渡的过程中,我们提出了一种行之有效的、低复杂度的鲁棒的声调识别方法,并将其与带调韵母方法进行了比较.这种方法在一个为声调识别专门设计的、包括64对同音不同调的人名数据库Pitch99上的测试中,识别率达到了78﹪(没有声调识别的话,识别率最高只有50﹪,因为无法区分每一对名字).带调韵母方法虽然能获得88﹪的识别率,存储和计算复杂度却是上述方法的三倍以上.

语音识别 声调识别方法 高维倒谱参数 识别率

王霞 董远 Juha Iso-Sipila

诺基亚中国研究开发中心(北京)

国内会议

第六届全国人机语音通讯学术会议

深圳

中文

25-29

2001-11-20(万方平台首次上网日期,不代表论文的发表时间)