基于机器学习的情感视位合成
在可视语音合成技术当中,对于表情的处理是非常关键的技术.然而,传统的可视语音合成技术由于受到算法本身以及样本数量的限制,往往忽略了在合成语音视频中对表情因素的处理,这直接导致了合成结果缺乏真实感和感染力.为了解决这一问题,本文在传统的数据驱动的可视语音合成技术上,融合了我们的参数化表情合成技术,创造性地提出了一种情感视位合成技术.从实验结果上看,本文提出的算法,有效地解决了传统可视语音合成中缺乏情感表现力的难题.
可视语音合成 参数化表情 图像合成 因素分解 权重模型 纹理拼接
周川 林学訚
清华大学计算机科学与技术系,北京,100084
国内会议
第十四届全国多媒体技术、第一届全国普适计算、第一届全国人机交互联合学术会议(第一届全国和谐人机环境联合学术大会)
昆明
中文
258-263
2005-10-26(万方平台首次上网日期,不代表论文的发表时间)