会议专题

实时语音驱动唇部同步动画

语音驱动唇部同步动画主要研究说话人在发出语音时的唇部动画。唇部动画是人脸动画系统的重要组成部分,在人机交互领域有着广泛的应用。本文提出了一种基于协同过滤算法的实时语音驱动唇部同步动画算法.该算法是一种基于样本的数据驱动方法,能够产生逼真的人脸唇部语音同步动画.语音参数采用语音识别中常用的梅尔倒谱系数(MFCC),动画参数使用MPEG-4中定义的人脸动画参数(FAP)。用该算法实现的系统可以同时用于男女声语音驱动唇部动画,也可以驱动与MPEG-4兼容的任何人脸头像模型进行动画。系统能满足实时性的要求,在主观评测中得到很高的评分。

实时语音驱动 人脸动画 协同过滤 唇部动画 梅尔倒谱系数 数据驱动 语音识别

穆凯辉 陶建华

中国科学院自动化研究所 模式识别国家重点实验室,北京市 100190

国内会议

2009中国计算机大会

天津

中文

855-862

2009-10-23(万方平台首次上网日期,不代表论文的发表时间)