实时语音驱动唇部同步动画

摘要：

语音驱动唇部同步动画主要研究说话人在发出语音时的唇部动画。唇部动画是人脸动画系统的重要组成部分，在人机交互领域有着广泛的应用。本文提出了一种基于协同过滤算法的实时语音驱动唇部同步动画算法.该算法是一种基于样本的数据驱动方法，能够产生逼真的人脸唇部语音同步动画.语音参数采用语音识别中常用的梅尔倒谱系数(MFCC)，动画参数使用MPEG-4中定义的人脸动画参数(FAP)。用该算法实现的系统可以同时用于男女声语音驱动唇部动画，也可以驱动与MPEG-4兼容的任何人脸头像模型进行动画。系统能满足实时性的要求，在主观评测中得到很高的评分。

关键词：实时语音驱动人脸动画协同过滤唇部动画梅尔倒谱系数数据驱动语音识别

作者: 穆凯辉陶建华

作者单位: 中国科学院自动化研究所模式识别国家重点实验室,北京市 100190

会议类型: 国内会议

会议名称: 2009中国计算机大会

会议地点: 天津

会议语种:中文

页码: 855-862

在线出版日期: 2009-10-23（万方平台首次上网日期，不代表论文的发表时间）

会议专题

实时语音驱动唇部同步动画