自然言语的韵律组织中的不确定性及其在语音合成中的应用
本文对自然言语的韵律组织中的不确定性及其对合成语音自然度的进行了初步的探讨.结果表明,同一个人在同样语义规划下,对同样文本的多遍发音中的韵律参数的变化范围可以达到这些参数的整体变化范围的50﹪左右.下是由于这种不确定性的存在,人类言语才变得丰富多彩.而且传统语音合成系统中韵律预测模型的弱点恰恰在于忽略了韵律预测中用最小错误概率准则代替传统的最大生成概率准则从而在预测结果中保留多种等价的韵律实现.本文还进一步提出一种将基于最小错误准则的韵律预测与单元选择结合的算法.该算法首先根据最小错误准则在所有候选单元中筛选出最不可能性造成韵律错误的样本,然后再依据最平滑拼接准则从各种韵律等价的路径中选出一条能达到最平滑拼接作为最后输出.
语音合成 自然言语 韵律组织 不确定性
初敏
微软亚洲研究院(北京)
国内会议
厦门
中文
210-214
2003-11-01(万方平台首次上网日期,不代表论文的发表时间)