会议专题

蒙古语连续语音识别在不同结构语言模型下精度的讨论

统计方法处理口语至今仍然是口语处理的核心技术. 目前处理水平较高的英语,中文及日本语等语言均采用统计处理方法. 但是,各自语言存在独特的发音方式和文本构造,即使是采用同类方法建立语音-语言模型,由于语言本身的差异也会引起性能上的较大差异. 研究和定量分析这种差异对于新语言口语处理性能的改善将有很大帮助. 本文以蒙古语为例研讨了黏着性语言语音识别在使用不同结构语言模型时的识别精度. 结果显示和常用bigram模型和聚类模型相比,通过相似词分类后的聚类模型可以提高识别精度.

蒙古语 连续语语音识别 统计语言模型 黏着语言 相似词分类 bigram模型

伊.达瓦 匂坂芳典 卢绪刚 中村哲

独立行政法人 信息通信研究所(NICT) 京都 日本 619-0288 日本国际电气通信基技术础研所(ATR) 京都 日本 619-0288 独立行政法人 信息通信研究所(NICT) 京都 日本 619-0288 日本早稻田大学国际通信技术研究科(GITI) 东京 169-855

国内会议

第十届全国人机语音通讯学术会议

乌鲁木齐

中文

18-23

2009-08-14(万方平台首次上网日期,不代表论文的发表时间)