一种利用语音激励源信息定位的声源跟踪方法
近几年来关于麦克风阵列在声源跟踪方面存在的优良性能日益引起人们的重视。与传统的麦克风使用方式相比,使用麦克风阵列作为语音采集设备,讲话者可以在一定范围内自由走动,且可以实现讲话者的自由切换,对讲话者进行跟踪。 要实现对声源的跟踪必须解决声源的精确定位。常用的声源定位方法有三种:波束形成,高分辨谱估计,时间延迟估计。其中波束形成方法的分辨率很低;高分辨谱估计通常只用在声源位置固定情况下的定位:时间延迟估计由于直接与声源位置相关,且计算效率很高,在声源跟踪过程中表现出很好的性能,因此被广为采用。 大多数求时延的方法是基于接收信号互相关最大化的。最常使用的是广义互相关法,但是由于噪声、混响造成的衰减的影响,语音信号谱发生畸变,利用广义互相关求时延的精度下降,而语音的激励源信息则不容易受到噪声和干扰的影响。因此本文把语音的激励源信息定位与IMM估计器对位置估计滤波结合起来,实现对运动声源轨迹的跟踪,最后对提出的跟踪算法进行仿真验证并与卡尔曼滤波器的跟踪效果作比较。
语音激励源 信息定位 声源跟踪 卡尔曼滤波器
刘肖静 孙超
西北工业大学声学工程研究所 西安,710072
国内会议
西安
中文
124-127
2009-12-01(万方平台首次上网日期,不代表论文的发表时间)