会议专题

一种混合使用连续HMM和离散HMM的HTS合成系统

传统的基于隐马尔可夫模型(HMM)的语音合成系统(HTS)存在两个问题,分别是时域的过平滑问题和频域的过平滑问题。为了解决这两个问题,本文提出了一种同时利用连续隐马尔可夫模型和离散隐马尔可夫模型的合成系统框架。传统的HTS合成系统使用高斯函数的均值表征频谱包络,这不可避免地带来了频域过平滑问题,而本文所提出系统通过使用来自于真实频谱的离散码本矢量表征频谱包络,有效地克服了频域上的过平滑问题;传统HTS系统利用动态参数生成完整频谱,导致生成的频谱在时域上缺少变化,而本文则提出一个精心设计的码本矢量选取算法来生成完整频谱,以此克服时域过平滑问题。实验证明,通过混合使用连续HMM和离散HMM,合成语音的清晰度可以得到极大提高。

语音合成 隐马尔可夫模型 语音处理 时域过平滑 频域过平滑

于剑 张蒙 陶建华 王霞

中科院自动化所模式识别国家重点实验室,北京 100080 诺基亚中国研究中心,北京

国内会议

第十三届全国信号处理学术年会

北京

中文

141-144

2007-08-01(万方平台首次上网日期,不代表论文的发表时间)