会议专题

面向多语言的语音识别声学模型建模方法研究

在实际应用中,许多潜在的语音识别任务都需要有多种语言的支持,但其中一些语言会面临数据资源缺乏的情况.因此,能够对非目标语言的语音数据进行利用,弥补目标语言资源受限所带来缺陷的多语言声学模型建模方法逐渐成为目前语音识别研究的一个热点和难点.本文以日语为例研究多语言声学模型建模方法,通过构建建模单元共享和模型参数共享两种不同的框架,对两种技术路线进行了分析与比较.实验结果表明,基于模型参数共享的方法取得较好效果,相较于未进行资源共享的基线系统可以获得相对26.6%的字错误率改善.

语音识别 声学模型 资源受限 多语言资源共享

姚海涛 徐及 潘接林 颜永红

中国科学院声学研究所语言声学与内容理解重点实验室 北京 100190

国内会议

中国声学学会第十一届青年学术会议

西安

中文

404-407

2015-10-15(万方平台首次上网日期,不代表论文的发表时间)