本发明涉及机载侦查载荷目标检测,尤其涉及一种用于机载宽视场侦查载荷的弱小目标识别与定位方法。
背景技术:
1、在机载侦察载荷应用场景中进行宽视场目标检测尤其是地面弱小目标的检测和定位是一项非常具有挑战性的任务。机载宽视场侦察载荷的图幅一般较大,图像尺度和分辨率差异较大,图像中存在较多背景噪声干扰,地面小目标本身尺寸小、数量多,而且在城市、郊野、森林等不同复杂场景中,目标的清晰度、颜色和空间分辨率较低,轮廓、颜色缺乏对比,纹理和几何特征较为模糊,在不同宽视场侦察图像中目标的尺度、旋转角度、目标密度也有所差异,如何在复杂的宽视场侦察图像中快速、准确的识别关心的地面弱小目标并进行定位是目前急需解决的问题。
2、当前基于深度学习的目标检测方法成为机载宽视场侦察图像目标检测的主流,诸如r-cnn、fast r-cnn、faster r-cnn、yolo系列、ssd系列的检测网络已经应用在本领域,目前主要针对建筑物、植被、道路、水系、桥梁、舰船等目标,这些目标在宽视场侦察图像中的尺度相对较大,并且通常是聚集在一定的区域,而对于相对稀疏分布与背景相似、边缘模糊的弱小目标识别检测性能不佳。近年来又出现了一些基于transformer结构改进的目标检测方法,大幅提升了模型的复杂程度和计算成本,部署和应用条件受限,尤其针对边缘端使用受限。
3、在视觉任务中小目标检测方法多基于主流的目标检测网络进行改进,尤其基于卷积神经网络的方法在提取底层特征方面有较大优势。在宽视场侦察图像目标检测中,已提出了多种较为有效的方法。文献基于密集连接与特征增强的遥感图像检测,使用密集连接网络改进yolov3,提升了对宽图幅图像的目标检测效果;文献scrdet:towards morerobust detection for small,cluttered and rotated objects在retinanet的基础上进行改进,并增加了空间和通道注意力,提升了小目标的检测准确率;文献deformable detr:deformable transformers for end-to-end object detection将transformer应用于目标检测领域,利用其自注意力机制关注全局信息,更好地实现视觉建模,但在宽视场图像中小目标检测效果上还有待提高。
4、进一步的,基于深度学习的目标检测方法一定程度上依赖于数据集规模及数据的多样性,而当前存在着高分辨率宽视场侦察图像数据集样本量不足、数据获取渠道不通畅的问题,以及新类别数据小样本训练易出现过拟合、降低模型泛化能力等问题,无法有效地将学习到的知识泛化到少量样本的新类上。
技术实现思路
1、为解决上述技术问题,本发明提出了一种用于机载宽视场侦查载荷的弱小目标识别与定位方法,以提升对弱小目标检测的效果。
2、为实现上述目的,本发明提供了一种用于机载宽视场侦查载荷的弱小目标识别与定位方法,包括:
3、对初始宽视场侦查图像进行预处理,生成目标图像;
4、将所述目标图像输入至宽视场侦察图像地面弱小目标检测网络模型进行目标检测,获得预测结果,所述宽视场侦察图像地面弱小目标检测网络模型利用改进的yolov5网络构建;
5、将所述预测结果转换到所述初始宽视场侦查图像中,对所述预测结果进行非极大值抑制,获取所述初始宽视场侦查图像中的目标检测结果;
6、基于所述目标检测结果利用像素位置与地理位置的映射关系,将所述目标检测结果中的像素位置信息转化为地理位置坐标,基于所述地理位置坐标进行目标定位。
7、优选地,对初始宽视场侦查图像进行预处理,包括:
8、读取所述初始宽视场侦查图像中的像素信息和地理信息,根据地图投影关系通过像素位置计算得到真实位置,获得像素位置和地理位置的映射关系;
9、对所述初始宽视场侦查图像进行校正,滤除图像背景中的各种干扰和噪声,对地形起伏、镜头畸变和相机倾斜进行调整;
10、对所述初始宽视场侦查图像的分辨率进行判别,当图像分辨率不大于设定值时进行自适应缩放,大于所述设定值时以设定的像素尺寸及自适应重叠度进行裁剪,获得切片图。
11、优选地,所述宽视场侦察图像地面弱小目标检测网络模型,包括:
12、数据增强模块:用于对输入的图像进行混合数据增强,获取多样性数据集;
13、特征提取模块:用于对所述多样性数据集进行特征提取;
14、特征融合模块:用于对提取的特征进行融合;
15、系数调整模块:用于生成小样本数据类别的语义特征和感兴趣区域的特征系数,调整网络模型侧重关注的元特征信息;
16、回归分类模块:用于对提取的多尺度融合特征进行回归预测。
17、优选地,所述特征提取模块为cswintransformer模块,所述cswintransformer模块通过层次化特征表示、交叉形窗口注意力机制以及局部增强位置编码,整合全局信息、局部信息和上下文信息,进行特征提取。
18、优选地,所述特征提取模块还包括:
19、spd_conv单元:用于将输入的所述多样性数据集中的特征图的空间块重新排列,进入深度维度特征提取;
20、sppfcspc单元:用于通过多尺度的空间金字塔池化和卷积操作,提升模型的感受野和特征表达能力。
21、优选地,所述特征融合模块为加权双向特征金字塔bifpn结构,所述bifpn结构用于捕获数据集中不同尺度上的特征,并增加第二注意力机制单元对特征信息进行处理,获得融合后的特征。
22、优选地,通过增加注意力机制单元对特征信息进行处理的方法为:
23、attention=f(g(x),x)
24、式中,x表示输入特征,f(·)表示结合注意力对输入特征进行处理,g(·)表示处理输入特征和产生注意力的过程,attention=f(g(x),x)表示基于注意力g(x)处理输入x的过程。
25、优选地,所述回归分类模块为解耦detect模块,所述解耦detect模块用于引入分支网络将不同特征图分开处理,改进iou损失函数为wiou,并引入动态聚焦机制,通过离群度替代一般iou对锚框进行质量评估,并为不同离群度的锚框分配不同梯度增益r=β/δαβ-δ,式中α、δ为设置的超参数,使锚框梯度增益随边界框动态变化。
26、优选地,所述宽视场侦察图像地面弱小目标检测网络模型中还能够增加注意力机制单元提升网络处理不同尺寸和复杂度对象的能力,所述注意力机制单元增加的位置根据感兴趣目标的尺寸及特征进行调整。
27、优选地,训练所述宽视场侦察图像地面弱小目标检测网络模型的数据集为采用建模仿真、公开数据、卫星或航拍实采数据途径构建的数据集,并建模仿真生成不同角度、不同尺度、不同类别、不同场景的目标图像,所述数据集中还包括易混淆背景负样本。
28、与现有技术相比,本发明具有如下优点和技术效果:
29、(1)本发明对于宽幅图像上稀疏分布的目标,设定一定重合度的裁剪方法,防止目标漏检,在回到原图时二次极大抑制,避免了目标在多张切片图中重复检测,且对不同图幅、分辨率宽视场侦察图像进行自适应预处理,定位效果好;
30、(2)本发明针对弱小目标检测,设计了特征提取、特征融合和回归分类模块,从图像全局特征提取、多尺度特征融合等多种手段,综合提升对弱小目标检测效果,提升模型的泛化能力和鲁棒性;
31、(3)本发明针对小样本目标检测问题,除了通过丰富数据集构建手段、数据增强手段,增加了基于注意力机制的系数调整模块,将小样本数据输入系数调整模块,可以利用相对大量的基类学习经验,以帮助应对小样本弱小目标检测问题。
1.一种用于机载宽视场侦查载荷的弱小目标识别与定位方法,其特征在于,包括:
2.根据权利要求1所述的用于机载宽视场侦查载荷的弱小目标识别与定位方法,其特征在于,对初始宽视场侦查图像进行预处理,包括:
3.根据权利要求1所述的用于机载宽视场侦查载荷的弱小目标识别与定位方法,其特征在于,所述宽视场侦察图像地面弱小目标检测网络模型,包括:
4.根据权利要求3所述的用于机载宽视场侦查载荷的弱小目标识别与定位方法,其特征在于,所述特征提取模块为cswintransformer模块,所述cswintransformer模块通过层次化特征表示、交叉形窗口注意力机制以及局部增强位置编码,整合全局信息、局部信息和上下文信息,进行特征提取。
5.根据权利要求4所述的用于机载宽视场侦查载荷的弱小目标识别与定位方法,其特征在于,所述特征提取模块还包括:
6.根据权利要求3所述的用于机载宽视场侦查载荷的弱小目标识别与定位方法,其特征在于,所述特征融合模块为加权双向特征金字塔bifpn结构,所述bifpn结构用于捕获数据集中不同尺度上的特征,并增加第二注意力机制单元对特征信息进行处理,获得融合后的特征。
7.根据权利要求6所述的用于机载宽视场侦查载荷的弱小目标识别与定位方法,其特征在于,通过增加注意力机制单元对特征信息进行处理的方法为:
8.根据权利要求3所述的用于机载宽视场侦查载荷的弱小目标识别与定位方法,其特征在于,所述回归分类模块为解耦detect模块,所述解耦detect模块用于引入分支网络将不同特征图分开处理,改进iou损失函数为wiou,并引入动态聚焦机制,通过离群度替代一般iou对锚框进行质量评估,并为不同离群度的锚框分配不同梯度增益r=β/δαβ-δ,式中α、δ为设置的超参数,使锚框梯度增益随边界框动态变化。
9.根据权利要求3所述的用于机载宽视场侦查载荷的弱小目标识别与定位方法,其特征在于,所述宽视场侦察图像地面弱小目标检测网络模型中还能够增加注意力机制单元提升网络处理不同尺寸和复杂度对象的能力,所述注意力机制单元增加的位置根据感兴趣目标的尺寸及特征进行调整。
10.根据权利要求1所述的用于机载宽视场侦查载荷的弱小目标识别与定位方法,其特征在于,训练所述宽视场侦察图像地面弱小目标检测网络模型的数据集为采用建模仿真、公开数据、卫星或航拍实采数据途径构建的数据集,并建模仿真生成不同角度、不同尺度、不同类别、不同场景的目标图像,所述数据集中还包括易混淆背景负样本。
