电话语音库的设计与实现
语音数据库是语音识别技术研究的基础.当语音技术的研究进入实用化阶段时,对语音库的建设也提出了更高的要求,因此,建立大规模、高质量的电话语音数据库是这一领域的关键性问题.本数据库是国家863支持的项目,采用自动方式收集长达数据百小时的电话语音数据,力争更全面地体现不同电话信道、不同地方口音、不同年龄段说话人的特点.本文详细讨论了自动电话数据采集系统的构建、录音文本的设计、数据采集方案的设定、数据的后处理标注等几个问题.电话语音库的建设工作预计于本年底完成,届时一个实用的电话语音库将可以投入到研究和应用中.
电话语音识别 语音数据库 电话数据采集
王侠 李明琴 肖熙 王作英
清华大学电子工程系
国内会议
厦门
中文
247-251
2003-11-01(万方平台首次上网日期,不代表论文的发表时间)