基于频谱弯曲的语音转换相似度改进

摘要：

本文中，我们对现有语音转换方法进行分析，并针对频谱弯曲方法相似度较低的问题，将频谱弯曲与单元挑选相结合以提高与目标人频谱细节上的相似度。我们首先利用频谱弯曲来获得弯曲后的源频谱。然后，我们利用弯曲后的源频谱作为预测目标从目标说话人频谱中进行单元挑选。最后，我们用挑选出来的目标说话人频谱对弯曲后的源频谱进行部分替换，以提高频谱细节上的相似度。评测结果表明，改进的方法与单纯的频谱弯曲相比能够获得约20”％”的相似度提高。文章最后提出了进一步的改进方向。

关键词：语音转换频谱弯曲相似度目标说话人

作者: 双志伟张世磊秦勇

作者单位: IBM中国研究院,Beijing,100094

会议类型: 国内会议

会议名称: 第十届全国人机语音通讯学术会议

会议地点: 乌鲁木齐

会议语种:中文

页码: 123-127

在线出版日期: 2009-08-14（万方平台首次上网日期，不代表论文的发表时间）

会议专题

基于频谱弯曲的语音转换相似度改进