会议专题

多语言自动总机系统

现今的社会中语言的使用是相当多元的,因此多语言语音识别(multilingual speech recognition)也就成了语音识别研究中一个重要的课题.目前普遍的做法是将针对各种不同语言所独立发展的完整的语音识别系统做结合,以达到辨识多语言语音的目的.然而在某些需要用到多语言语音识别的实用系统中,大部分的使用者都还是以单一主要语言为主,较少使用到其它的语言.本文即是针对这种特殊需求所设计的多语言自动总机系统,在最主要的中文人名辨识部分,我们建立一个以中文音节模型(sub-syllable model)为基础的关键词萃取(keyword spotting)系统,而在较少使用到的非中文(包含英文与地方方言)人名部分,则依据系统实际需要建立以全词模型(whole word model)为基础的单词语音识别器,最后则是利用一个以信心值(confidence measure)为基础的决策机制来决定系统的结果输出.目前我们的系统规格设定为可辨识6500个中文人名及50个非中文人名(40个英文人名和10个闽南语人名).实验结果在中文人名部分的辨识正确率为91.70﹪,而非中文人名部份则有92.23﹪,显示系统能有效解决特殊应用下的多语言语音识别问题.

语音识别 多语言自动总机系统

张森嘉 简世杰 涂家章

工研院电通所前瞻技术中心(台湾新竹)

国内会议

第五届全国现代语音学术会议

北京

中文

384-386

2001-08-30(万方平台首次上网日期,不代表论文的发表时间)