会议专题

汉语对话语气韵律建模方法的研究

本文构建了一个普通话对话语气韵律模型。在构建该对话语气韵律模型的过程中,本文借鉴了现有陈述语气韵律模型的研究成果,同时针对对话语气所独有的特点对其进行了扩展。与陈述语气相比,对话语气最明显的特点在于其具有较快的语速和较窄的调域,然而仅仅通过变换语速和调域却仍然无法模拟出对话语气的特征。本文指出,对话语气与陈述语气的差别通常体现在:对话语气中音节内部基频曲线往往无法完成其原先固有的调形,本文将这种现象称为“未完成现象”。为了模拟这种现象,本文首先利用分类树预测一个音节是正常音节还是未完成音节,并通过在基频曲线生成模型中对未完成音节进行特殊处理,使之能够生成具有对话语气韵律特征的基频曲线。听辨实验证明,基于本文所提出韵律模型合成的语音表现更加自然和口语化。

语音合成 对话语气 韵律建模 系统评价

于剑 黄力行 陶建华

中国科学院自动化研究所,模式识别国家重点实验室,北京,100080

国内会议

第九届全国人机语言通讯学术会议

安徽黄山

中文

2007-10-21(万方平台首次上网日期,不代表论文的发表时间)