麦克风阵列处理的研究主要包括声源定位、语音增强、音源分离、去混响以及鸡尾酒会效应。
麦克风阵列较单麦克风在时域和频域的基础上增加了空域,可对空间来之不同方向的信号进行空时频联合处理,弥补单麦克风在去噪,定位,音源分离的等方面的不足。
一、声源定位:
利用空间分布的多路麦克风拾取声音信号,通过麦克风阵列的各路输出信号来估计声源空间位置。声源定位的方法包括波束成形、超分辨谱估计以及TDOA法。这三种方法分别将声源与阵列结构关系转为空间波束、空间谱或到达时间差等信息,并通过估计这些信息进行声源定位。
1.波束形成方法。
这是较早的声源定位方法,可分为常规波束成形(CBF)和自适应波束成形(ABF)。
常规波束成形是最简单的波束形成方法,其对各麦克风的输出信号进行加权求和,以得到波束,并引导波束搜索声源可能的位置。它也称为延时求和波束形成器。其中对应于各阵元通道的权值取决于起接收信号的相位延迟。
CBF中,各通道的权值是固定的,起作用是抑制阵列方向图的旁边电平,以滤除旁瓣区域的干扰源和噪声。因为通过波束在空域搜索确定的声源,即假定位于阵列方向图主瓣内的信号源是声源,而主瓣外的旁瓣区域的为不需要的信号源,即为干扰和噪声。
ABF是在CBF的基础上,对干扰和噪声进行空域自适应滤波。ABF中,采用不同的滤波器又可得到不同的算法。ABF中,各通道的幅度加权值根据接收信号并基于某种最优准则而进行自适应台调整。常用的有LMS、LS、最大SNR,以及LCMV(线性约束最小方差,Linearly Constrained Minimum Variance)等。采用LCMV准则即可得到常用的MVDR(最小方差无失真响应 Minimum Variance Distortionless Response)波束形成器。
LCMV准则是,在方向图主瓣增益保持不变的情况下,是阵列的输出功率最小。因为是用主瓣检测目标,因而主瓣的增益不变就意味着接受的声源的功率保持不变;此时阵列的输出功率最小,表明阵列输出的干扰噪声的功率最小。因而LCMV准则就是SINR最大准则,从而能够最大可能的接收信号并抑制干扰和噪声。这种ABF中,计算自适应权需使用麦克风阵列的输出协方差矩阵,并要求这段数据时间内的声源信号和接收系统的噪声是平稳的。不是所有的ABF都可用于声源定位,如基于LMS准则的ABF(其无需DOA信息)。
波束成形方法只适用于单个声源。若有多个声源同时位于阵列方向图主波束内,则对各声源的方向无法区分;即这种方法的定位精度取决于阵列的波束宽度。另一方面,根据天线阵列的基本原理,阵列方向图的波束宽度与阵列孔径成反比;因此波束成型方法的定位精度与麦克风阵列的孔径成反比。
2、超分辨空间谱估计
这列方法包括多重信号分类(MUSIC)、基于旋转不变技术的信号参数估计(ESPRIT)、子空间拟合等,其对阵列接收信号的协方差矩阵(相关矩阵)进行分解,构造空间谱(即关于方向的频谱);谱峰对应的方向即为声源的方向。这里方法适用于多个声源的情况,且对声源方向的超分辨率与麦克风阵列的波束宽度以及孔径无关,即吐蕃了阵列波束宽度的限制,成为超分辨。因此可达到很高的测向精度与分辨率。
这类方法可扩展用于宽带信号。但超分辨空间谱估计方法的局限性是对阵列误差非常敏感,包括麦克风位置误差、通道不一致性等。这类方法一般只适用于远场生源情况(即麦克风阵列与声源的距离远大于麦克风的间距),应用于进场时其性能下降很大。另外他们常要进行谱峰搜索,计算量大。
3、TDOA定位
TDOA(到达时差)方法线估计声源达到不同麦克风的时间差,再利用时差计算声源到达各麦克风的距离差;再利用距离差和麦克风的阵列空间用几何方法确定声源位置。TDOA式麦克风阵列声源定位最广泛的方法。TDOA方法在电子侦察以及无源定位中也有非常重要的应用,但处理的为窄带信号且SNR高。而将其用于宽带高混响的麦克风整列时,需添加一些特殊的滤波器并进行预处理。
该方法包含2个步骤:
(1)TDOA估计
TDOA定位的第一步时估计时差。其有很多方法,常用的有广义互相关法(GCC)以及LMS自适应滤波。
1》广义互相关法GCC
利用同一声源的相关性,通过麦克风阵列的接收信号的互相关函数来估计时延(TDOA),该方法可在时域或频域上计算时差。为了提高抗噪、抗混响性能以及时延估计精度,可通过改进GCC;包括相位变换法、平滑变换法。基于TDOA的声源定位中,主要用GCC进行时延估计。GCC法计算简单,时延小、跟踪能力强,适用于实时应用;在中等强度噪声和低混响环境下性能较好。但在嘈杂环境下,定位精度下降严重。
2》LMS自适应滤波
在收敛情况下,给出TDOA的估值,无需信号与噪声的先验知识;但对噪声和混响较为敏感