新闻播报言语数据库构建及韵律标注
将篇章层面的文本转换为准确、生动的合成语音,涉及了语言计算、韵律建模、语音合成等一系列技术问题。而这些问题的解决,一方面需要制定一个更具科学性的韵律描述方案,用以做为语言学与声学间的信息交互接口,进而构建语音合成系统的语言学、语音学计算模块;另一方面还将依赖具有丰富标注信息的言语数据库,由此提供定性分析与定量计算的实际样本。因而,言语数据库及其韵律标注,构成了合成系统研究的基础。本文选取新闻播报语料为研究/加工素材,综合考虑计算建模需求及样本的特点,制定了一套新闻播报言语数据库的韵律标注内容及其标注规范。本文对语篇的停顿、重音、语气、语调的标注规范进行了具体的阐述;通过对言语数据库构建及韵律标注的具体实施,证实了所制定的韵律标注规范的科学性。
言语数据库 韵律标注 新闻播报 语音合成 语篇停顿 语调
李晓红 朱维彬 何伟 邹煜
北京交通大学 信息科学研究所,北京 100044 中国传媒大学 国家语言资源监测与研究中心有声媒体语言分中心,北京 100024
国内会议
乌鲁木齐
中文
471-476
2009-08-14(万方平台首次上网日期,不代表论文的发表时间)