一种利用语音激励源信息定位的声源跟踪方法

摘要：

近几年来关于麦克风阵列在声源跟踪方面存在的优良性能日益引起人们的重视。与传统的麦克风使用方式相比，使用麦克风阵列作为语音采集设备，讲话者可以在一定范围内自由走动，且可以实现讲话者的自由切换，对讲话者进行跟踪。要实现对声源的跟踪必须解决声源的精确定位。常用的声源定位方法有三种:波束形成，高分辨谱估计，时间延迟估计。其中波束形成方法的分辨率很低;高分辨谱估计通常只用在声源位置固定情况下的定位:时间延迟估计由于直接与声源位置相关，且计算效率很高，在声源跟踪过程中表现出很好的性能，因此被广为采用。大多数求时延的方法是基于接收信号互相关最大化的。最常使用的是广义互相关法，但是由于噪声、混响造成的衰减的影响，语音信号谱发生畸变，利用广义互相关求时延的精度下降，而语音的激励源信息则不容易受到噪声和干扰的影响。因此本文把语音的激励源信息定位与IMM估计器对位置估计滤波结合起来，实现对运动声源轨迹的跟踪，最后对提出的跟踪算法进行仿真验证并与卡尔曼滤波器的跟踪效果作比较。

关键词：语音激励源信息定位声源跟踪卡尔曼滤波器

作者: 刘肖静孙超

作者单位: 西北工业大学声学工程研究所西安,710072

会议类型: 国内会议

会议名称: 2009年上海-西安声学学会学术交流会

会议地点: 西安

会议语种:中文

页码: 124-127

在线出版日期: 2009-12-01（万方平台首次上网日期，不代表论文的发表时间）

会议专题

一种利用语音激励源信息定位的声源跟踪方法