会议专题

基于共振峰增强训练算法的HTS 研究与改进

传统的基于隐马尔可夫模型的语音合成系统(HTS)存在着合成参数过平滑问题,导致合成结果音质下降。过平滑问题可以分为时域过平滑和频域过平滑。本文对这两个问题进行分析,并通过实验研究它们对合成结果音质下降影响的程度。实验表明时域过平滑对音质下降的影响不大,而频域过平滑对音质下降影响较大。针对频域过平滑问题,本文提出基于一种与LSF相关的新参数的共振峰增强训练方法对训练算法的运算过程进行改进,实验证明其合成结果优于传统HTS合成结果。

语音合成 隐马尔可夫模型 合成参数 频域过平滑 共振峰增强算法

张蒙 陶建华

中国科学院自动化研究所,模式识别国家重点实验室,北京,100080

国内会议

第九届全国人机语言通讯学术会议

安徽黄山

中文

2007-10-21(万方平台首次上网日期,不代表论文的发表时间)