唇读中序列口型的分类
本文针对汉语中所有声韵母发音序列中的连续口型提出了一种口型分类的思路.在建立了覆盖所有声韵母的汉语双模态语料库的基础之上,本文提出了一种两次分类的方法,对语料库中的图像进行唇的分割、定位及特征提取,并依靠选择的特征,将声韵母的发音序列中的口型聚为15类.本文的目的是在此分类的基础上,明确唇读识别阶段的状态数,减小搜索的空间,提高收敛速度.
唇读 双模态语料库 口型聚类 语音识别
单卫 姚鸿勋 高文
哈尔滨工业大学计算机科学与工程系(哈尔滨)
国内会议
深圳
中文
13-18
2001-11-20(万方平台首次上网日期,不代表论文的发表时间)