自然语音驱动的人脸口型合成关键技术研究
本文研究了自然语音驱动的人脸口型合成关键技术,包括连续语音的口型识别技术和MPEG-4参数化人脸动画合成方法。介绍了口型模型建立、声学模型的建立及训练、Viterbi beam搜索、路径回溯确定模型串接序列等口型识别过程。也介绍了基于FDP、FAP参数的人脸合成方法,讨论了中间动画帧口型参数的平滑方法。最后,给出了各个重要阶段的实验结果。
口型识别 可视音素 人脸口型合成 自然语音
徐明 胡瑞敏 欧阳建军
深圳大学信息中心 广东深圳 518060 武汉大学计算机学院 湖北武汉 430000 武汉大学计算机学院 湖北武汉 430000 深圳大学信息中心 广东深圳 518060
国内会议
中国第二十届电路与系统学术年会暨2007年港澳内地电子信息学术研讨会
深圳
中文
158-162
2007-06-01(万方平台首次上网日期,不代表论文的发表时间)