语音驱动说话人头部中的基于决策树的Triseme建模方法
Viseme是在语音驱动说话人头部动画模型中常用的一种音频-视频模型.为了得到更精确的模型就要考虑驱动语音的上下文信息,因此引入了Triseme模型.但是引入Triseme模型后,随着模型数量的急剧增加将导致训练数据的严重不足.模型状态捆绑可以缓解这一问题.本文将决策树方法引入triseme状态捆绑中,实现对”不可见”模型的建模,同时也讨论了决策树视频问题集合的设计.
Viseme Triseme 决策树 视频问题集合 口形相似度 音频-视频模型
谢磊 蒋冬梅 赵荣椿 Ilse Cravyse Hichem Sahli Jan Conlenis
西北工业大学 Dept,ETRO Free University Brussels,Belgium
国内会议
昆明
中文
258-262
2002-10-01(万方平台首次上网日期,不代表论文的发表时间)