基于主动感知的音视频联合说话人跟踪方法

摘要：

本文将主动感知理论中的注意机制用于说话人跟踪问题,提出一种基于主动感知的音视频联合说话人跟踪方法.该方法将自底向上与自顶向下两种控制策略相结合,首先从麦克风阵列的多路语音信号中提取出听觉全局特征图,根据全局显著性度量进行注意焦点转移,实现摄像机的指向控制;然后利用说话人的视频信息,采用粒子滤波在感受野的中央区域进行注意焦点跟踪,进而确定说话人的空间位置.实验结果验证了本文方法的有效性.

关键词：说话人跟踪主动感知音频信号视频信号

作者: 金乃高侯刚王学辉李非墨

作者单位: 大连理工大学软件学院,辽宁大连 116620

会议类型: 国内会议

会议名称: 2010年通信理论与信号处理学术年会

会议地点: 大连

会议语种:中文

页码: 531-536

在线出版日期: 2010-08-20（万方平台首次上网日期，不代表论文的发表时间）

会议专题

基于主动感知的音视频联合说话人跟踪方法