论语音库的共建与共享

摘要：

本文主要介绍笔者近年来围绕这一课题所开发的一系列工具，其中主要包括五个方面:(一)语音库录制工具xRecorder，这一工具主要解决录音参数、语音库信息、发音人信息等方面的标准化问题，并能通过振幅自动检测以确保录音质量;(二)语音库音段自动切分工具xSegment，基于这一工具，用户可以自己建立发音词典，针对任意语言的语音材料进行声学模型训练和音段自动切分，其结果会保存为TextGrid格式，能够在一定程度上降低语音库标注的难度;(三)语音库数据上传工具xUploader，基于这一工具，用户可以将语音库的全部数据批量上传至特定的网络服务器，其中包括声音文件、发音文本文件、参数配置文件(含语音库信息和发音人信息)、发音词典文件、音段切分文件、声学模型文件等等，从而实现语音数据资源的共享;(四)九州语言网，特定用户基于这一网络平台，可以查看和管理自己上传的语音数据，并可下载其他用户所共享的语音资源数据库;(五)语音库分析工具xPraat，这一工具由一系列Praat脚本组成，能帮助用户对大规模语音数据库进行分析和数据提取。

关键词：语音库录音质量网络平台信息共享

作者: 熊子瑜

作者单位: 中国社会科学院语言研究所

会议类型: 国内会议

会议名称: 第十一届中国语音学学术会议

会议地点: 乌鲁木齐

会议语种:中文

页码: 347-347

在线出版日期: 2014-08-08（万方平台首次上网日期，不代表论文的发表时间）

会议专题

论语音库的共建与共享