基于频谱弯曲的语音转换相似度改进
本文中,我们对现有语音转换方法进行分析,并针对频谱弯曲方法相似度较低的问题,将频谱弯曲与单元挑选相结合以提高与目标人频谱细节上的相似度。我们首先利用频谱弯曲来获得弯曲后的源频谱。然后,我们利用弯曲后的源频谱作为预测目标从目标说话人频谱中进行单元挑选。最后,我们用挑选出来的目标说话人频谱对弯曲后的源频谱进行部分替换,以提高频谱细节上的相似度。评测结果表明,改进的方法与单纯的频谱弯曲相比能够获得约20”%”的相似度提高。文章最后提出了进一步的改进方向。
语音转换 频谱弯曲 相似度 目标说话人
双志伟 张世磊 秦勇
IBM中国研究院,Beijing,100094
国内会议
乌鲁木齐
中文
123-127
2009-08-14(万方平台首次上网日期,不代表论文的发表时间)