基于动态基元选取的真实感可视语音合成系统

摘要：

伴有说话者面部表情及唇动的文本.可视语音转换系统(TTVS)能够大大增强人机交互的生动性和真实感.结合当前主要的两类rⅣs技术,利用数据驱动法中的动态基元拼接获得参数序列,驱动MPEG-4人脸动画模型,在保留灵活性和可移植性等优点的前提下,以较小的数据量,获得了较为生动的效果,形成了具有较高真实感的中文可视语音合成系统.

关键词：可视语音合成系统动态基元拼接可视韵律 MPEG-4模型人脸动画

作者: 周密穆凯辉陶建华

作者单位: 中科院自动化所模式识别国家重点实验室,北京,100190

会议类型: 国内会议

会议名称: 第八届全国虚拟现实与可视化学术会议(CCVRV”08)

会议地点: 福州

会议语种:中文

页码: 420-422,426

在线出版日期: 2008-09-01（万方平台首次上网日期，不代表论文的发表时间）

会议专题

基于动态基元选取的真实感可视语音合成系统