一个面向少数民族语种识别的电话语音数据库
本文介绍一个以语种识别为目的而构建的中国少数民族语电话语音数据库,该数据库包括9种少数民族语和汉语普通话。在该语音数据库中,每种民族语言将选请50个发音人,男女各占一半;每个发音人将有一段谈话录音和20句时间不等的自动问答录音;除汉语发音人外,每个民族语发音人分别用本民族语和汉语普通话完成谈话录音和自动问答录音;整个语音数据库将有950段16分钟左右的谈话录音和19000句时间不等的自动问答录音。该语音数据库的构建对中国少数民族语种识别和口音识别的研究有着至关重要的作用。
少数民族语 语音数据库 语种识别 民族口音 汉语借词
徐永华 杨鉴 陈江 陈瑶玲
云南大学 信息学院,昆明 650091
国内会议
乌鲁木齐
中文
410-413
2009-08-14(万方平台首次上网日期,不代表论文的发表时间)