会议专题

电话语音库的设计与实现

语音数据库是语音识别技术研究的基础.当语音技术的研究进入实用化阶段时,对语音库的建设也提出了更高的要求,因此,建立大规模、高质量的电话语音数据库是这一领域的关键性问题.本数据库是国家863支持的项目,采用自动方式收集长达数据百小时的电话语音数据,力争更全面地体现不同电话信道、不同地方口音、不同年龄段说话人的特点.本文详细讨论了自动电话数据采集系统的构建、录音文本的设计、数据采集方案的设定、数据的后处理标注等几个问题.电话语音库的建设工作预计于本年底完成,届时一个实用的电话语音库将可以投入到研究和应用中.

电话语音识别 语音数据库 电话数据采集

王侠 李明琴 肖熙 王作英

清华大学电子工程系

国内会议

第七届全国人机语音通讯学术会议

厦门

中文

247-251

2003-11-01(万方平台首次上网日期,不代表论文的发表时间)