基于迭代优化算法的麦克风阵列自校准声源定位系统的制作方法

xiaoxiao2020-10-23 36

基于迭代优化算法的麦克风阵列自校准声源定位系统的制作方法
【技术领域】
[0001] 本发明属于声源定位技术领域，具体涉及一种麦克风阵列声源定位系统。
【背景技术】
[0002] 声源定位技术是指通过电学和声学装置对语音信号进行拾取和处理，继而确定和跟踪声源空间位置的技术。在机器人，语音增强，安防系统，摄像头智能监控以及智能家居等方面有广泛的应用。
[0003] 声源定位技术主要可以分成三类：第一类是基于最大输出功率的可控波束形成技术，当传声器阵列探测到信号时，对各路信号进行加权求和形成波束，直到得到具有最大输出功率的波束为止。该方法可以对单声源进行定位，也可以对多声源进行定位，但存在对初值敏感的问题。另外还需要知道声源和噪声的先验知识，而且计算量大，不利于实时处理。第二类是高分辨率谱估计技术，该算法是针对窄带信号，如要获得较理想的精度，需要利用传声器阵列获取的信号计算空间谱的相关矩阵，计算量也比较大；另外该算法无法处理高度相关的信号，混响会给算法的定位精度带来较大影响；在实际操作过程中很少采用。第三类是基于声达时间差（time difference of arrival，TD0A)的定位技术，利用到达阵列上各传声器的声音信号间的时间差来定位声源，这类技术计算量小，比较适用于实时处理，在实际应用中占有很大的比重。但传统时延法基于近似公式，仅能实现远场的声源定位，在近场和非远场的定位效果不是很理想。
[0004] 本发明基于迭代优化算法设计了一种七元麦克风阵列声源定位系统，该系统可以实现三维空间的近场和远场的声源定位，并且可以进行自校准。其不仅适用于水平方位的角度跟踪而且能够三维追踪声源高度，具有结构简单，体积小，重量轻，携带方便等优点。相较于传统的近似公式，该算法在近场也能实现声源位置的精确定位。算法占用的RAM和ROM 小，运算量小定位精确。

【发明内容】

[0005] 本发明的目的在于提供一种基于迭代优化算法的自校准麦克风阵列声源定位系统。
[0006] 本发明提供的基于迭代优化算法的自校准麦克风阵列声源定位系统，首先，设计在三轴方向上都包含三组麦克风的七元麦克风阵列，该麦克风阵列具备自校准功能，如图2 所示；然后，将空间平面划分为8个象限，利用声源到达各坐标轴上两个麦克的时延差的正负值大致判断声源所在象限，如图3所示；最后，在预估象限内选取一个较大的棱锥区域，要求该区域包含声源点，通过迭代优化算法对棱锥区域不断收缩，将声源点锁定在一个很小的区域内实现准确定位，如图4所示。
[0007] 本发明提供的基于迭代优化算法的自校准麦克风阵列声源定位系统，其框图如图 1所示，包括：麦克风阵列、多声道采集模块、声源定位系统；各部分功能如下：所述麦克风阵列，为在三轴方向上都包含三组麦克风的七元麦克风阵列，用于获取声源各个麦克风之间的语音信号；所述多声道采集模块，以48K的采样频率对各个麦克风获取的语音信号进行采样，并将语音信号传入声源定位系统（DSP)等待处理；所述声源定位系统包括：语音检测、时延估计和声源方位估计3个部分；其中，语音检测部分采用A/D转换将麦克采集的语音信号转换为对应的电信号，并用可移动的有限长度窗口进行分帧；时延估计部分利用加权广义互相关运算获取各个麦克风之间的时延值，实现采样的自校准以及声源所在象限的估算；声源方位估计部分是在象限内选取一个包含声源的较大棱锥区域，采用迭代优化算法，逐渐收缩，实现声源的精确定位。
[0008] 本发明中，所述七元麦克风阵列，在三轴方向上都包含三组麦克风，用于获取声源到达各个麦克风之间的语音信号，借助多声道采集模块以48K的采样频率对各语音信号进行采样并将信号传入声源定位系统系统等待处理。其中，采用A/D转换可以将麦克采集的声信号转换为对应的电信号，用可移动的有限长度窗口进行分帧，再利用加权广义互相关运算获取各个麦克风之间的时延值，实现采样的自校准以及声源所在象限的估算。
[0009] 本发明中，所述迭代优化算法，首先判断确定声源点所在象限，进一步利用迭代收缩的方法对其优化，实现声源目标的精确定位。具体操作如下：在定位象限中选取四个点： 0, A，B，C，构成棱锥区域，作为假定声源点，该棱锥区域包裹目标声源点；定义待优化函数，优化目标是该函数的运算值趋于〇 ;将四个点：〇，A，B，C的坐标分别代入该优化函数；剔除误差较大的点，再用棱锥的重心替代刚刚被剔除的点，构成新的棱锥区域；重复上述操作；棱锥区域会不断趋近声源目标位置，通过不断收缩可以将定位范围锁定在一个很小的区域里。
[0010] 本发明设计了在三轴方向上都包含三组麦克风的七元麦克风阵列，并具备自校准功能；在求解时采用了迭代优化算法，利用数值解逼近最优解，可以获取精确的近场和远场声源空间位置定位。本发明系统不仅适用于水平方位的角度跟踪，而且能够三维追踪声源高度，结构简单，体积小，重量轻，携带方便。相较于传统仅适用于远场的近似公式，该算法在近场也能实现声源位置的精确定位而且算法占用的RAM和ROM小，运算量小定位精确。
【附图说明】
[0011] 图1为麦克风阵列声源定位系统框图。
[0012] 图2为麦克风阵列示意图。
[0013] 图3为象限划分示意图。
[0014] 图4为定位算法演示。
【具体实施方式】
[0015] 在利用本发明系统进行声源定位测试时，用麦克风阵列获取声源到达各个麦克风之间的语音信号，借助多声道采集模块以48K的采样频率对各语音信号进行采样并将信号传入声源定位系统系统等待处理。采用A/D转换可以将麦克采集的声信号转换为对应的电信号，再利用加权广义互相关运算获取各个麦克风之间的时延值，实现采样的自校准以及声源所在象限的估算；在象限内选取一个包含声源的较大棱锥区域，采用迭代优化算法逐渐收缩区域实现声源的精确定位。
[0016]在具体的测试过程中，需要获取两个麦克之间的时延值，具体的流程为： (1) 架设一个在三轴方向上都包含三组麦克风的七元麦克风阵列，用麦克风阵列获取声源到达各个麦克风之间的语音信号； (2) 采用多声道采集模块，以48K的采样频率对各语音信号进行采样，并将信号传入声源定位系统等待处理； (3) 采用A/D转换可以将麦克采集的声信号转换为对应的电信号； (4) 由麦克风1和麦克风2获得语音信号，用可移动的有限长度窗口进行分帧，对信号进行傅里叶变换，得到两个信号的本帧互功率谱：
按照一定的权值进行频域加权之后通过逆傅里叶变换得到本帧的互相关函数
找到Kt)峰值处就是两个麦克风1和麦克风2间的时延；其中t为时延差参数，《为角频率，步12 ( ? )为对应于这两个麦克风的加权窗口，G12 ( ? )为对应于这两个麦克风的功率谱函数；同理，可获得其余的两两麦克风间的时延。
[0017]在进行声源定位时需要测试声源自校准和大致定位声源所在象限，示意图如图2 所示，具体流程为： (1) 分别记录声源到麦克风1和原点0的延时射声源到麦克风2和原点0的延时，声源到麦克风3和原点0的延时，声源到麦克风4和原点0的延时，声源到麦克风5和原点0的延时ikM，声源到麦克风6和原点0的延时irw，声源到麦克风2 和原点1的延时，声源到麦克风4和原点3的延时4，声源到麦克风6和原点5的延时叙S.i ; (2) 当满足
则记录的测试声源点正确，否则视为无效测试点，应重新测试，实现测试声源自校准； (3) 根据同轴上两个接收点之间的时延差确定定位象限，示意图如图3所示，
&
将点定位于第I象限，
，将点定位于第II 象限，
，将点定位于第III象限，
将点定位于第iv象限，
将点定位于第v象限/ _
I *
,将点定位于第VI象限，
，将点定位于第VII象限，
，将点定位于第VIII象限，实现声源所在象限的定位。其中， "&"是"并且"的符号表达。
[0018] 在进行声源精确定位时需要利用迭代优化进行收缩，确定声源所在精确范围，示意图如图4所示，具体流程为： (1)构造如下优化函数R (x，y，z)，求解目标是R (x，y，z )趋近于0:
其中，其中，c为声音速率=340米/秒
分别为求解点到四个基准点的距离，四个基准点分别为原点0 (0, 0, 0)，x轴EU 0, 0)，y轴F(0, a，0)，z轴G(0, 0, a)。其中a是放置麦克的位置，考虑到使发明的设备体积小，可以取其为一个小值5cm。i% ，血2分别为利用互相关采集的原点〇与E点，F点，G点获取声源之间的延时；
(2)在声源所在象限选取4个参考点，假设声源点位于第I象限，在第I象限中选取四个点 0 (0, 0, 0)，A (Xl，0, 0)，B (0, y2, 0)，C (0, 0, z3)作为假定声源点，0, A，B，C 四点组成的棱椎体将声源S包裹在棱椎体内部(如图4中初始域);当声源点位于其它象限时，作类似处理； (3 ) 0, A，B，C分别代入优化函数，将R (0)，R (A)，R (B)，R (C)中最大数值对应的点剔除，再用棱锥体的重心替代刚刚被剔除的点，构成新的棱锥体； (4)重复步骤（3)，计算此时四个点的优化函数R(x，y，z)的值，并剔除较大数值对应的点，用新棱锥体的重心替代刚刚被剔除的点；通过不断收缩可以将定位范围锁定在一个很小的区域里(如图4中最终域)，当锁定区域足够小可无限逼近真实声源点，此时将 R(x，y，z)值最小的点作为声源点S。
【主权项】
1. 一种基于迭代优化算法的麦克风阵列自校准声源定位系统，其特征在于包括：麦克风阵列、多声道采集模块、声源定位系统；其中：所述麦克风阵列，为在三轴方向上都包含三组麦克风的七元麦克风阵列，用于获取声源各个麦克风之间的语音信号；所述多声道采集模块，以48K的采样频率对各个麦克风获取的语音信号进行采样，并将语音信号传入声源定位系统等待处理；所述声源定位系统包括：语音检测、时延估计和声源方位估计3个部分；其中，语音检测部分采用A/D转换将麦克采集的语音信号转换为对应的电信号，并用可移动的有限长度窗口进行分帧；时延估计部分包括：利用加权广义互相关运算获取各个麦克风之间的时延值，并实现采样的自校准以及声源所在象限的估算；声源方位估计部分是在象限内选取一个包含声源的较大棱锥区域，采用迭代优化算法，逐渐收缩，实现声源的精确定位。2. 根据权利要求1所述的基于迭代优化算法的麦克风阵列自校准声源定位系统，其特征在于所述声源方位估计部分在象限内选取一个包含声源的较大棱锥体区域，采用迭代优化算法，逐渐收缩，实现声源的精确定位的流程为：在定位象限中选取四个点：〇, A，B，C，构成棱锥体区域，作为假定声源点，该棱锥体区域包裹目标声源点；定义待优化函数，优化目标是该函数的运算值趋于O ;将四个点：〇, A，B，C的坐标分别代入该优化函数；剔除误差较大的点，再用棱锥体的重心替代刚刚被剔除的点，构成新的棱锥体区域；重复上述操作；棱锥体区域会不断趋近声源目标位置，通过不断收缩可以将定位范围锁定在一个很小的区域里。3. 根据权利要求1所述的基于迭代优化算法的麦克风阵列自校准声源定位系统，其特征在于所述时延估计部分包括：利用加权广义互相关运算获取各个麦克风之间的时延值，并实现采样的自校准以及声源所在象限的估算；其中，计算时延值的流程为：设麦克风阵列中，由第一麦克风和第二麦克风获得语音信号，用可移动的有限长度窗口进行分帧，对信号进行傅里叶变换，得到两个信号的本帧互功率谱：，按照一定的权值进行频域加权之后通过逆傅里叶变换得到本帧的互相关函数找到峰值处就是第一麦克风和第二麦克风间的时延；其中τ为时延差参数，ω为角频率，Φ12 (ω)为对应的加权窗口，G12 (ω)为对应的功率谱函数；同理，可获得其余的两两麦克风间的时延；采样的自校准以及声源所在象限的估算的流程为： (1) 分别记录声源到第一麦克风和原点〇的延时，声源到第二麦克风和原点O的延时，声源到第三麦克风和原点〇的延时Irw，声源到第四麦克风和原点O的延时Ifw，声源到第五麦克风和原点〇的延时Iiw，声源到第六麦克风和原点〇的延时Mw，声源到第二麦克风和原点1的延时，声源到第四麦克风和原点3的延时，声源到第六麦克风和原点5的延时Ir5i ; (2) 当满万则记录的测试声源点正确，否则视为无效测试点，应重新测试，实现测试声源自校准； (3)根据同轴上两个接收点之间的时延差确定定位象限，#/> O & Δτ3ρ O > 0，将点定位于第1象限，#::>〇&1^1(4+<.0&1『">〇，将点定位于第11象限，< >:<〇 &Arw < 0&Δγμ> 0,将点定位于第in象限，4? >0&射34< >0,将点定位于第IV 象限，> 0& Aru > 0&Arw < 0,将点定位于第 V 象限，Δι^ < 0&ir34 > 0&??54 <+ 0,将点定位于第Vi象限，Δγ14 < 0&irS4 <0< 0,将点定位于第VIi象限，Ιτι;: > 0 &iru <0 &lfM < 0，将点定位于第VIIi象限，实现声源所在象限的定位。4.根据权利要求2或3所述的基于迭代优化算法的麦克风阵列自校准声源定位系统，其特征在于所述声源方位估计部分在象限内选取一个包含声源的较大棱锥区域，采用迭代优化算法，逐渐收缩，实现声源的精确定位的流程为： (1)构造如下优化函数R(X，y，z)，求解目标是优化函数R(X，y，z)趋近于O : Rf V V '：一 i I t ? } - ? 屬 Λ τ · r·! if 議* 碰.Λ τ * r! 广 1 、 I. t\t -** ; J-?..' Λ~. · ~Λ t. y U ； ' I ?αζ. ita. I - & ' - S- ; - ： W - u-l X m U ? \ X y 其中，C为声音速率=340米/秒；Li, Ly，L/分别为求解点到四个基准点的距离，四个基准点分别为原点O (〇, 0, 0)，X轴EU 0, 0)，y轴F(0, a，0)，z轴G(0, 0, a)，这里a 是放置麦克的位置，Δτχ，Λτ:/，Al/分别为利用互相关采集的原点O与E点，F点，G点获取声源之间的延时，C为声速；(2)在声源所在象限选取4个参考点，假设声源点位于第I象限，在第I象限中选取四个点 O (0, 0, 0)，A (Xl，0, 0)，B (0, y2, 0)，C (0, 0, Z3)作为假定声源点，0, A，B，C 四点组成的棱椎体，将声源S包裹在棱椎体内部，作为初始域；当声源点位于其它象限时，作类似处理； (3)把0, A，B，C分别代入优化函数R (X，y，z)，将R (O)，R (A)，R (B)，R (C)中最大数值对应的点剔除，再用棱锥体的重心替代刚刚被剔除的点，构成新的棱锥体； (4)重复步骤（3)，计算此时四个点的优化函数R(x, y, z)的值，并剔除较大数值对应的点，用新棱锥体的重心替代刚刚被剔除的点；通过不断收缩可以将定位范围锁定在一个很小的区域里，当锁定区域足够小可无限逼近真实声源点，此时将R(x，y，z)值最小的点作为声源点S。
【专利摘要】本发明属于声源定位技术领域，具体为基于迭代优化算法的自校准麦克风声源定位系统。本发明系统包括：麦克风阵列，为在三轴方向上都包含三组麦克风的七元麦克风阵列，用于获取声源各个麦克风之间的语音信号；多声道采集模块，以48K的采样频率对各个麦克风获取的语音信号进行采样，并将语音信号传入声源定位系统等待处理；声源定位系统包括：语音检测、时延估计和声源方位估计3个部分；声源方位估计部分是在象限内选取一个包含声源的较大棱锥区域，采用迭代优化算法，逐渐收缩，实现声源的精确定位。该系统不仅适用于水平方位的角度跟踪而且能够三维追踪声源高度，结构简单，体积小，重量轻，携带方便。
【IPC分类】G01S5/20
【公开号】CN104898091
【申请号】CN201510290127
【发明人】孙放, 来金梅
【申请人】复旦大学
【公开日】2015年9月9日
【申请日】2015年5月29日

2012-2014专利技术

最新回复(0)