会议专题

论语音库的共建与共享

本文主要介绍笔者近年来围绕这一课题所开发的一系列工具,其中主要包括五个方面:(一)语音库录制工具xRecorder,这一工具主要解决录音参数、语音库信息、发音人信息等方面的标准化问题,并能通过振幅自动检测以确保录音质量;(二)语音库音段自动切分工具xSegment,基于这一工具,用户可以自己建立发音词典,针对任意语言的语音材料进行声学模型训练和音段自动切分,其结果会保存为TextGrid格式,能够在一定程度上降低语音库标注的难度;(三)语音库数据上传工具xUploader,基于这一工具,用户可以将语音库的全部数据批量上传至特定的网络服务器,其中包括声音文件、发音文本文件、参数配置文件(含语音库信息和发音人信息)、发音词典文件、音段切分文件、声学模型文件等等,从而实现语音数据资源的共享;(四)九州语言网,特定用户基于这一网络平台,可以查看和管理自己上传的语音数据,并可下载其他用户所共享的语音资源数据库;(五)语音库分析工具xPraat,这一工具由一系列Praat脚本组成,能帮助用户对大规模语音数据库进行分析和数据提取。

语音库 录音质量 网络平台 信息共享

熊子瑜

中国社会科学院语言研究所

国内会议

第十一届中国语音学学术会议

乌鲁木齐

中文

347-347

2014-08-08(万方平台首次上网日期,不代表论文的发表时间)