会议专题

面向印度英语语音识别的语音语料库构建研究

本文在印度英语语音语料库的构建方面进行了有益的探索,具有以下两点应用价值:(1)便于语言研究者进行印度英语变体与标准英语语音特点的对比研究;(2)为印度英语语音识别的声学模型训练提供语音语料的支持。本文通过基于众包的语音标注方式,提出针对标注语音的4层质量审核策略以及根据数据分析结果对用户进行适当奖惩的机制,使得印度英语语音标注在人力资金成本、标注工作效率和标注语音质量等方面都有一定程度的改善。对于标注人员资源较少的小语种或语言变体,本文提供了一种较为可行的语音语料库构建模式。

印度英语 语音识别 语料库 标注方式

金鑫 张克亮

解放军外国语学院,河南洛阳471003

国内会议

中国声学学会2017年全国声学学术会议

哈尔滨

中文

655-656

2017-09-22(万方平台首次上网日期,不代表论文的发表时间)