自然语音驱动的人脸口型合成关键技术研究

摘要：

本文研究了自然语音驱动的人脸口型合成关键技术,包括连续语音的口型识别技术和MPEG-4参数化人脸动画合成方法。介绍了口型模型建立、声学模型的建立及训练、Viterbi beam搜索、路径回溯确定模型串接序列等口型识别过程。也介绍了基于FDP、FAP参数的人脸合成方法,讨论了中间动画帧口型参数的平滑方法。最后,给出了各个重要阶段的实验结果。

关键词：口型识别可视音素人脸口型合成自然语音

作者: 徐明胡瑞敏欧阳建军

作者单位: 深圳大学信息中心广东深圳 518060 武汉大学计算机学院湖北武汉 430000 武汉大学计算机学院湖北武汉 430000 深圳大学信息中心广东深圳 518060

会议类型: 国内会议

会议名称: 中国第二十届电路与系统学术年会暨2007年港澳内地电子信息学术研讨会

会议地点: 深圳

会议语种:中文

页码: 158-162

在线出版日期: 2007-06-01（万方平台首次上网日期，不代表论文的发表时间）

会议专题

自然语音驱动的人脸口型合成关键技术研究