基于主动感知的音视频联合说话人跟踪方法
本文将主动感知理论中的注意机制用于说话人跟踪问题,提出一种基于主动感知的音视频联合说话人跟踪方法.该方法将自底向上与自顶向下两种控制策略相结合,首先从麦克风阵列的多路语音信号中提取出听觉全局特征图,根据全局显著性度量进行注意焦点转移,实现摄像机的指向控制;然后利用说话人的视频信息,采用粒子滤波在感受野的中央区域进行注意焦点跟踪,进而确定说话人的空间位置.实验结果验证了本文方法的有效性.
说话人跟踪 主动感知 音频信号 视频信号
金乃高 侯刚 王学辉 李非墨
大连理工大学软件学院,辽宁 大连 116620
国内会议
大连
中文
531-536
2010-08-20(万方平台首次上网日期,不代表论文的发表时间)