会议专题

语音合成自然度的客观度量实验研究

  随着语音合成技术的发展,合成语音的音质和可懂度不断提高,而如何进一步提高其自然度成为语音合成方面的重要问题。本文总结了近年来主流的波形拼接式语音合成系统在自然度方面影响主观感受的四类问题,分析了它们对自然度主观感受的影响、产生的原因以及进行测试和改进的方法。考虑到不自然点的定位与检测对于自然度问题发现与改进的重要作用,本文针对其中与语音相关的两类问题,音调连续性和结尾自然度,分别提出了基频连续性和波形包络在停顿前的连续性两种不自然点的客观度量方法,并在此基础上进一步设计了语音自然度中不自然点的自动定位与检测算法。实验数据表明,人工听辨发现的音调不自然点都可以通过基频不连续点检测出来,并且在较为挑剔的自然度评判中,该算法有较高的准确率;而通过波形包络在长停顿前的不连续点检测,可以非常精确地发现结尾不自然的点。在语音合成系统的评测和改进工作中,本文提出的客观度量和不自然点自动检测方法提供了比人工听辨更可信的数据参考,具有较高的实用价值。

语音自然度 客观度量 基频连续性 波形包络

国内会议

第十届中国语音学学术会议

上海

中文

1-6

2012-05-01(万方平台首次上网日期,不代表论文的发表时间)