本发明属于声源定位,尤其涉及一种基于cnn和music的时空联合声源定位方法。
背景技术:
1、声音对于外界信息的获取非常重要,根据物体发出的声音,人们可以判断出物体的相对方位,某些对定位精度要求较高的应用场合,人们往往需要用仪器完成声音定位,声源定位技术可广泛应用于军事方面,如船舶、大型车辆的故障排查以及飞行器检测,也可用于主要噪声源的定位、通信设备或语音识别处理中的目标选择和干扰抑制。
2、中国专利cn111273230b公开了一种声源定位方法,属于声源定位技术领域,包括:步骤s1,接收原始声源信号,并处理得频率值;步骤s2,采用陷波设计公式处理得到每个预设方向上的波束系数;步骤s3,对原始声源信号进行扫描,随后根据波束系数,对扫描结果进行处理;步骤s4,处理得到多个预设方向上的陷波降噪量;步骤s5,将陷波降噪量中的最大值所对应的预设方向确定为原始声源信号中的期望声源的声源方向;不仅定位精度优于基于最大输出功率的延迟累加波束形成算法的定位精度,而且算法整体运算量较小,但在实际使用时,缺乏对不同声源信号的快速降噪优化能力,并且容易因声源位置影响到处理效率,存在改进的空间。
技术实现思路
1、本发明的目的在于:为了解决缺乏对声源信号的降噪优化能力,并且容易因声源位置影响到处理效率,存在改进的空间的问题,而提出的一种基于cnn和music的时空联合声源定位方法。
2、为了实现上述目的,本发明采用了如下技术方案:
3、所述空域处理包括通过传感器麦克风建立球面坐标系,分解为纵向麦克风阵列以及横向麦克风阵列,利用系中三个麦克风获得声音相对(0,0,0)的水平角(a)和俯仰角(β),确定两条空间直线,利用梯度下降法,得到距离两条直线距离,声源位于两侧直线之间,分解后得到两个模型以及两组角度,最近的点即为声源所在。
4、作为上述技术方案的进一步描述:
5、所述时域处理包括降噪自编码器进行声音信号去噪和降维处理;
6、用matlab生成随机噪音的声源信息经去噪后训练网络;
7、将网络输出的距离信息按一定权重对空域处理后的声源位置进行补偿。
8、作为上述技术方案的进一步描述:
9、所述模型建立方法包括:
10、记纵向麦克风接收信号为x1(t)=as1(t)+n1(t),横向麦克风接收信号为x2(t)=as2(t)+n2(t);
11、利用music算法得到声源相对于纵(横)向麦克风中心的单位方向向量,记,即dl,cl的单位方向向量;
12、纵向与横向麦克风阵列中心坐标分别为p1=(k1,y1,z1),p2=(k2,y2,z2),将数据代入公垂线计算公式,得到公垂线中点m;
13、放入训练好的神经网络模型中,得到修正后的估计坐标i。
14、作为上述技术方案的进一步描述:
15、所述空域处理的处理步骤包括:通过空间平滑music算法,当线性阵列信号模型,远场目标源到达传感器的信号为s(t)以ω为中心频率的理想信号:
16、
17、作为上述技术方案的进一步描述:
18、所述模型建立应满足以离信号最近的阵元作为参考点,相邻的阵元可以表示为:
19、
20、假设m个距离为d的阵元,k个来自不同方向的窄带远场信号,其中第i个阵元接收到的信号可以表示为:
21、
22、用阵列入射角向量和信号源向量点乘表示这个第i个阵元接收信号,很显然第一个i=1的阵元入射信号就是k个远场e信号的直接相加:
23、x1(t)=[s(1)+s(2)+....+s(k)];
24、分别定义噪声矢量:
25、n(t)=[n1(t),n2(t),....,nm(t)]t;
26、得到输出矢量:
27、x(t)=[x1(1),x2(2),....,xm(t)]t;
28、其中,x(t)=as(t)+n(t)。
29、作为上述技术方案的进一步描述:
30、所述前向空间平滑图步骤包括:
31、将m个阵元的等距线阵用滑动的方式分成l个子阵列,每个阵列有n个单元,其中n=m-l+1;定义第l个前向子阵列的输出为:
32、
33、其中,am为n×k维的方向矩阵,其列为n维的导向矢量am(θi)(i=1,2…k);
34、空间平滑矩阵的表示如下:
35、
36、对各个协方差矩阵求平均得到前向平滑矩阵:
37、
38、对其进行特征值分解,利用特征向量构建两个正交的子空间,即信号子空间和噪声子空间:
39、ry=[u1,u2,...,um]diag(λ1,λ2,...,λn)[u1,u2,...,um]h;
40、将噪声特征向量作为列向量,组成噪声特征矩阵,并张成m-d维的噪声子空间un,噪声子空间与信号子空间正交;
41、而us的列空间向量恰与信号子空间重合,所以us的列向量与噪声子空间也是正交的,由此,可以构造空间谱函数:
42、
43、改变参数pmusic使得最大即为声源相对方向。
44、作为上述技术方案的进一步描述:
45、所述滤波器窗函数的选择为256。
46、作为上述技术方案的进一步描述:
47、所述音频数据的降噪方法包括:利用matlab生成加噪声的音频数据,生成数据;
48、噪声符合标准正态分布:
49、
50、建立编码模型,编码到向量空间,神经网络编码器层输出向量后,并输出数据,训练后保存最优模型。
51、综上所述,由于采用了上述技术方案,本发明的有益效果是:
52、本发明中,通过提出利用两次传统空间平滑music算法求声源位置,利用自动编解码找到隐性向量空间进行音频信号去噪,利用卷积神经网络提取声音信号的时域信息,通过cnn和music的时空联合实现对声音的定位,可用于通信设备或语音识别处理中的目标选择和干扰抑制,通过数字信号处理技术将麦克风阵列接收到的声音信号进行分析和处理,以确定出声源的具体位置,有利于建立更好的人机交互环境。
1.一种基于cnn和music的时空联合声源定位方法,其特征在于,包括用传感器阵列接收声音信号数据,得到信号源的观测数据,通过神经网络模型cnn和music算法对声音信号数据进行空域处理和时域处理后,得到定位的坐标位置。
2.根据权利要求1所述的基于cnn和music的时空联合声源定位方法,其特征在于,所述空域处理包括通过传感器麦克风建立球面坐标系,分解为纵向麦克风阵列以及横向麦克风阵列,利用系中三个麦克风获得声音相对(0,0,0)的水平角(a)和俯仰角(β),确定两条空间直线,利用梯度下降法,得到距离两条直线距离,声源位于两侧直线之间,分解后得到两个模型以及两组角度,最近的点即为声源所在。
3.根据权利要求1所述的基于cnn和music的时空联合声源定位方法,其特征在于,所述时域处理包括降噪自编码器进行声音信号去噪和降维处理;
4.根据权利要求1所述的基于cnn和music的时空联合声源定位方法,其特征在于,所述模型建立方法包括:
5.根据权利要求1所述的基于cnn和music的时空联合声源定位方法,其特征在于,所述空域处理的处理步骤包括:通过空间平滑music算法,当线性阵列信号模型,远场目标源到达传感器的信号为s(t)以ω为中心频率的理想信号:
6.根据权利要求5所述的基于cnn和music的时空联合声源定位方法,其特征在于,所述模型建立应满足以离信号最近的阵元作为参考点,相邻的阵元可以表示为:
7.根据权利要求6所述的基于cnn和music的时空联合声源定位方法,其特征在于,所述前向空间平滑图步骤包括:
8.根据权利要求7所述的基于cnn和music的时空联合声源定位方法,其特征在于,所述滤波器窗函数的选择为256。
9.根据权利要求3所述的基于cnn和music的时空联合声源定位方法,其特征在于,所述音频数据的降噪方法包括:利用matlab生成加噪声的音频数据,生成数据;
