863语音识别语音语料库RASC863--四大方言普通话语音库
语音库的制作和分发应该是一个系统工程,每一步都应该遵从特定的规范,以便数据交换.本文按照数据库制作规范,介绍863四大方言普通话语音语料库(包括上海、广州、重庆和厦门普通话)--RASC863(863 annotated 4 regional accent speech corpus).RASC863包括自然口语部分、朗读部分(语音平衡和常用口语句)和方言词汇.口语设立了160个话题,由发音人任意选择一个,然后讲述相内容4-5分钟.朗读语料是挑选的语音平衡的句子共2200句和600个常用语句.每个方言点的发音人为200人,共800人.覆盖率不同年龄、性别和教育背景.
语音识别 语音语料库 普通话
李爱军 王天庆 殷治纲
中国社会科学院语言所
国内会议
厦门
中文
274-277
2003-11-01(万方平台首次上网日期,不代表论文的发表时间)