汉语对话语气韵律建模方法的研究

摘要：

本文构建了一个普通话对话语气韵律模型。在构建该对话语气韵律模型的过程中，本文借鉴了现有陈述语气韵律模型的研究成果，同时针对对话语气所独有的特点对其进行了扩展。与陈述语气相比，对话语气最明显的特点在于其具有较快的语速和较窄的调域，然而仅仅通过变换语速和调域却仍然无法模拟出对话语气的特征。本文指出，对话语气与陈述语气的差别通常体现在：对话语气中音节内部基频曲线往往无法完成其原先固有的调形，本文将这种现象称为“未完成现象”。为了模拟这种现象，本文首先利用分类树预测一个音节是正常音节还是未完成音节，并通过在基频曲线生成模型中对未完成音节进行特殊处理，使之能够生成具有对话语气韵律特征的基频曲线。听辨实验证明，基于本文所提出韵律模型合成的语音表现更加自然和口语化。

关键词：语音合成对话语气韵律建模系统评价

作者: 于剑黄力行陶建华

作者单位: 中国科学院自动化研究所，模式识别国家重点实验室，北京，100080

会议类型: 国内会议

会议名称: 第九届全国人机语言通讯学术会议

会议地点: 安徽黄山

会议语种:中文

在线出版日期: 2007-10-21（万方平台首次上网日期，不代表论文的发表时间）

会议专题

汉语对话语气韵律建模方法的研究