新闻播报言语数据库构建及韵律标注

摘要：

将篇章层面的文本转换为准确、生动的合成语音，涉及了语言计算、韵律建模、语音合成等一系列技术问题。而这些问题的解决，一方面需要制定一个更具科学性的韵律描述方案，用以做为语言学与声学间的信息交互接口，进而构建语音合成系统的语言学、语音学计算模块；另一方面还将依赖具有丰富标注信息的言语数据库，由此提供定性分析与定量计算的实际样本。因而，言语数据库及其韵律标注，构成了合成系统研究的基础。本文选取新闻播报语料为研究/加工素材，综合考虑计算建模需求及样本的特点，制定了一套新闻播报言语数据库的韵律标注内容及其标注规范。本文对语篇的停顿、重音、语气、语调的标注规范进行了具体的阐述；通过对言语数据库构建及韵律标注的具体实施，证实了所制定的韵律标注规范的科学性。

关键词：言语数据库韵律标注新闻播报语音合成语篇停顿语调

作者: 李晓红朱维彬何伟邹煜

作者单位: 北京交通大学信息科学研究所,北京 100044 中国传媒大学国家语言资源监测与研究中心有声媒体语言分中心,北京 100024

会议类型: 国内会议

会议名称: 第十届全国人机语音通讯学术会议

会议地点: 乌鲁木齐

会议语种:中文

页码: 471-476

在线出版日期: 2009-08-14（万方平台首次上网日期，不代表论文的发表时间）

会议专题

新闻播报言语数据库构建及韵律标注