一种基于麦克风阵列的声源定位算法研究 |
|
|
一种基于麦克风阵列的声源定位算法研究
引 言 基于麦克风阵列的论文联盟http://wWw.LWlm.Com声源定位是声学信号处理领域中的一个重要问题。麦克风阵列声源定位技术是指利用空间分布的多路麦克风拾取声音信号,通过对麦克风的多路输出信号进行分析和处理,得到一个或多个声源的位置信息。 麦克风阵列声源定位具有广泛的应用前景。它在民用领域可用于电话会议系统、视频会议系统和可视电话系统中,通过对发声者的定位,实现会议现场声源及外接摄像机的实时跟踪,也可用于语音及说话人识别软件的前端预处理,以拾取高质量的声音信号,提高语音及说话人识别软件的识别率,还可用于助听器等领域[1]。在军事领域,可利用麦克风阵列声源定位技术实现狙击手定位[2],地面或低空声目标的定位与追踪[3]等。 尽管可将用于声纳和雷达系统的波束形成技术引入麦克风阵列,但由于语音信号为宽带信号,具有短时平稳特性,且所处环境还具有高混响,噪声大等特点,这些算法针对语音信号的定位精度非常低,需要对算法进行改进。一般来说,常用的声源定位算法划分为三类[4]: 一是基于波束成型的方法; 二是基于高分辨率谱估计的方法; 三是基于波达时延差(TDOA)的方法。编辑:www.ybask.Com 。 其中基于波束成形方法通过对麦克风阵列接收信号进行滤波、加权求和,直接控制麦克风阵列指向使波束具有最大输出功率的方向,可在目标源多于一个的条件下对多声源进行定位[5],但存在对初值敏感的问题。另外还需要知道声源和噪声的先验知识,该方法存在计算量大,不利于实时处理等缺点。 基于高分辨率谱估计的方法在理论上可以对声源的方向进行有效估计,但由于该算法是针对窄带信号,因此若要获得较理想的精度,就要付出很大的计算量代价。此外这些算法无法处理高度相关的信号,因此混响会给算法的定位精度带来较大影响[6]。 基于时延估计的方法是利用广义互相关等时延估计算法求出信号到阵列不同麦克风的相对时延,并利用时延信息与麦克风阵列的空间位置关系估计声源位置。该方法计算量小,易于实时实现,近年来得到了高度重视。本文主要采用基于时延估计的方法进行声源定位。 1 基于TODA方法的基本原理 利用TDOA [1] [2] [3] [4] 下一页 |
|
|
|
上一个论文: 医用超声源声强测量不确定度 下一个论文: 周恩来知识分子思想中的哲学观 |
|