基于动态基元选取的真实感可视语音合成系统
伴有说话者面部表情及唇动的文本.可视语音转换系统(TTVS)能够大大增强人机交互的生动性和真实感.结合当前主要的两类rⅣs技术,利用数据驱动法中的动态基元拼接获得参数序列,驱动MPEG-4人脸动画模型,在保留灵活性和可移植性等优点的前提下,以较小的数据量,获得了较为生动的效果,形成了具有较高真实感的中文可视语音合成系统.
可视语音合成系统 动态基元拼接 可视韵律 MPEG-4模型 人脸动画
周密 穆凯辉 陶建华
中科院自动化所模式识别国家重点实验室,北京,100190
国内会议
福州
中文
420-422,426
2008-09-01(万方平台首次上网日期,不代表论文的发表时间)