一种图像分割方法、设备、程序产品及介质与流程

xiaoxiao5月前 28

本发明涉及计算机视觉，特别涉及一种图像分割方法、设备、程序产品及介质。

背景技术：

1、图像分割（image segmentation）是计算机视觉领域中的一项重要技术，近年来，在图像处理领域，基于预设深度学习模型架构的应用取得了令人瞩目的成果，其出色的全局建模能力使其在图像分割任务中展现出巨大的潜力。尽管基于预设深度学习模型架构的图像分割技术在许多任务上表现优异，但它们在感受野（receptive field）和多尺度处理方面仍存在显著问题。不仅因为其较高的计算复杂度导致难以直接应用于高分辨率图像的处理，限制了感受野；同时还因为其在处理多尺度信息时并不具备天然的优势，导致往往需要额外的模块或改进来提升其在多尺度场景下的表现。因此，在实际应用中，基于预设深度学习模型架构的图像分割技术的实现方式效果并不理想。

技术实现思路

1、有鉴于此，本发明的目的在于提供一种图像分割方法、设备、程序产品及介质，能够实现图像分割模型性能及计算效率的双重提升。其具体方案如下：

2、第一方面，本技术公开了一种图像分割方法，包括：

3、构建基于预设卷积神经网络的基础图像分割模型；

4、在所述基础图像分割模型中利用多尺度卷积操作对用于进行图像分割的数据集进行特征提取，以得到不同尺度的特征；

5、基于预设深度学习模型架构构建线性注意力机制，并利用高斯误差线性单元激活函数作为所述线性注意力机制的构造函数，然后将所述特征通过所述线性注意力机制进行特征融合，以得到多尺度融合特征图；

6、对所述多尺度融合特征图进行上采样与拼接操作，并为所述基础图像分割模型配置相应的损失函数与优化器以得到目标图像分割模型，以便利用所述目标图像分割模型进行图像分割。

7、可选的，所述构建基于预设卷积神经网络的基础图像分割模型之前，还包括：

8、收集用于进行图像分割的数据集，并对所述数据集中的图像数据进行数据预处理与数据增强；其中，数据预处理用于对所述图像数据进行标准化处理；数据增强用于对所述图像数据进行随机裁剪、旋转、翻转以及颜色抖动中的任意一项或多项组合操作。

9、可选的，所述构建基于预设卷积神经网络的基础图像分割模型，包括：

10、初始化预设卷积神经网络，并去除所述预设卷积神经网络中最后的全连接层，然后为所述预设卷积神经网络选择相应的目标版本类型，以得到所述基础图像分割模型。

11、可选的，所述在所述基础图像分割模型中利用多尺度卷积操作对用于进行图像分割的数据集进行特征提取，以得到不同尺度的特征，包括：

12、确定用于进行图像分割的数据集中每个特征向量对应的序列数据；

13、将所述序列数据进行映射处理，以得到对应的查询矩阵、键矩阵和值矩阵；

14、在所述基础图像分割模型中利用多尺度卷积操作分别对所述查询矩阵、所述键矩阵和所述值矩阵进行特征提取，以得到不同尺度的特征。

15、可选的，所述将所述特征通过所述线性注意力机制进行特征融合，以得到多尺度融合特征图，包括：

16、利用基于所述高斯误差线性单元激活函数的所述线性注意力机制的计算公式对特征提取后的所述查询矩阵、所述键矩阵和所述值矩阵进行计算，并将计算后得到的各输出矩阵依次进行矩阵连接与线性变换，以得到所述多尺度融合特征图。

17、可选的，所述图像分割方法，还包括：

18、获取基于多头注意力机制并行输出的多尺度融合特征图，并将并行输出的多尺度融合特征图依次进行矩阵连接与线性变换，以得到目标输出；

19、相应的，所述对所述多尺度融合特征图进行上采样与拼接操作，并为所述基础图像分割模型配置相应的损失函数与优化器以得到目标图像分割模型，包括：

20、对所述目标输出进行上采样与拼接操作，并为所述基础图像分割模型配置相应的损失函数与优化器以得到目标图像分割模型。

21、可选的，所述为所述基础图像分割模型配置相应的损失函数与优化器以得到目标图像分割模型，包括：

22、为所述基础图像分割模型配置相应的损失函数与优化器，并利用梯度裁剪技术以消除梯度爆炸得到所述目标图像分割模型。

23、可选的，所述对所述多尺度融合特征图进行上采样与拼接操作，包括：

24、对所述多尺度融合特征图使用转置卷积操作进行上采样，并在上采样的过程中将当前层的特征与相应的编码层的特征进行拼接。

25、可选的，所述对所述多尺度融合特征图进行上采样与拼接操作，并为所述基础图像分割模型配置相应的损失函数与优化器以得到目标图像分割模型的过程中，还包括：

26、为所述基础图像分割模型设置训练过程中的批量大小与训练轮次；

27、基于所述批量大小与所述训练轮次对所述基础图像分割模型进行行模型训练，并在每个所述训练轮次后利用验证集对当前的基础图像分割模型进行验证，以便根据验证结果对所述基础图像分割模型进行参数调优。

28、可选的，所述对所述多尺度融合特征图进行上采样与拼接操作，并为所述基础图像分割模型配置相应的损失函数与优化器以得到目标图像分割模型之后，还包括：

29、使用所述目标图像分割模型在测试集上进行验证，并利用预设评估指标对所述目标图像分割模型进行评估。

30、可选的，所述使用所述目标图像分割模型在测试集上进行验证，并利用预设评估指标对所述目标图像分割模型进行评估，包括：

31、获取利用所述目标图像分割模型对所述测试集进行图像分割的分割结果，并根据所述预设评估指标对所述分割结果进行可视化分析，以验证所述目标图像分割模型的分割效果。

32、可选的，所述对所述多尺度融合特征图进行上采样与拼接操作，并为所述基础图像分割模型配置相应的损失函数与优化器以得到目标图像分割模型，以便利用所述目标图像分割模型进行图像分割之后，还包括：

33、确定目标应用场景，并将所述目标图像分割模型导出为能够部署于所述目标应用场景的目标部署格式；

34、按照所述目标部署格式将所述目标图像分割模型部署于所述目标应用场景，以便基于所述目标部署格式利用所述目标图像分割模型进行图像分割。

35、第二方面，本技术公开了一种电子设备，包括：

36、存储器，用于存储计算机程序；

37、处理器，用于加载并执行所述计算机程序以实现前述的图像分割方法。

38、第三方面，本技术公开了一种计算机程序产品，包括计算机程序/指令，所述计算机程序/指令被处理器执行时实现前述的图像分割方法的步骤。

39、第四方面，本技术公开了一种计算机可读存储介质，用于存储计算机程序；其中所述计算机程序被处理器执行时实现前述的图像分割方法。

40、本技术提供了一种图像分割方法，包括：构建基于预设卷积神经网络的基础图像分割模型；在所述基础图像分割模型中利用多尺度卷积操作对用于进行图像分割的数据集进行特征提取，以得到不同尺度的特征；基于预设深度学习模型架构构建线性注意力机制，并利用高斯误差线性单元激活函数作为所述线性注意力机制的构造函数，然后将所述特征通过所述线性注意力机制进行特征融合，以得到多尺度融合特征图；对所述多尺度融合特征图进行上采样与拼接操作，并为所述基础图像分割模型配置相应的损失函数与优化器以得到目标图像分割模型，以便利用所述目标图像分割模型进行图像分割。

41、本技术有益技术效果为：在算法层面，通过引入基于高斯误差线性单元激活函数的线性注意力机制，在全局感受野的实现上大幅降低计算复杂度，保证模型全局感受野的同时，显著减少计算资源的消耗，从而提升计算效率。此外，针对多尺度特征提取问题，引入多尺度卷积操作实现特征融合的策略，来加强基于高斯误差线性单元激活函数的线性注意力机制针对局部特征信息提取的能力，可以提升模型对不同尺度特征的感知能力。在硬件层面，基于得到的多尺度融合特征图为模型配置相应的优化器来提升计算效率，确定最终的目标图像分割模型，利用目标图像分割模型实现自动化图像分割任务。如此一来，结合上述两方面的创新机制有效地将基于预设深度学习模型架构的模块融入高精度图像分割模型，实现了图像分割模型性能及计算效率的双重提升。

42、此外，本技术提供的一种图像分割设备、程序产品及介质，与上述图像分割方法对应，效果同上。

技术特征：

1.一种图像分割方法，其特征在于，包括：

2.根据权利要求1所述的图像分割方法，其特征在于，所述构建基于预设卷积神经网络的基础图像分割模型之前，还包括：

3.根据权利要求1所述的图像分割方法，其特征在于，所述构建基于预设卷积神经网络的基础图像分割模型，包括：

4.根据权利要求1所述的图像分割方法，其特征在于，所述在所述基础图像分割模型中利用多尺度卷积操作对用于进行图像分割的数据集进行特征提取，以得到不同尺度的特征，包括：

5.根据权利要求4所述的图像分割方法，其特征在于，所述将所述特征通过所述线性注意力机制进行特征融合，以得到多尺度融合特征图，包括：

6.根据权利要求1所述的图像分割方法，其特征在于，还包括：

7.根据权利要求1所述的图像分割方法，其特征在于，所述为所述基础图像分割模型配置相应的损失函数与优化器以得到目标图像分割模型，包括：

8.根据权利要求1所述的图像分割方法，其特征在于，所述对所述多尺度融合特征图进行上采样与拼接操作，包括：

9.根据权利要求1所述的图像分割方法，其特征在于，所述对所述多尺度融合特征图进行上采样与拼接操作，并为所述基础图像分割模型配置相应的损失函数与优化器以得到目标图像分割模型的过程中，还包括：

10.根据权利要求1所述的图像分割方法，其特征在于，所述对所述多尺度融合特征图进行上采样与拼接操作，并为所述基础图像分割模型配置相应的损失函数与优化器以得到目标图像分割模型之后，还包括：

11.根据权利要求10所述的图像分割方法，其特征在于，所述使用所述目标图像分割模型在测试集上进行验证，并利用预设评估指标对所述目标图像分割模型进行评估，包括：

12.根据权利要求1至11任一项所述的图像分割方法，其特征在于，所述对所述多尺度融合特征图进行上采样与拼接操作，并为所述基础图像分割模型配置相应的损失函数与优化器以得到目标图像分割模型，以便利用所述目标图像分割模型进行图像分割之后，还包括：

13.一种电子设备，其特征在于，包括：

14.一种计算机程序产品，包括计算机程序/指令，其特征在于，所述计算机程序/指令被处理器执行时实现权利要求1至12任一项所述的图像分割方法的步骤。

15.一种计算机可读存储介质，其特征在于，用于存储计算机程序；其中所述计算机程序被处理器执行时实现权利要求1至12任一项所述的图像分割方法。

技术总结
本申请公开了一种图像分割方法、设备、程序产品及介质，涉及计算机视觉技术领域。该方法包括：构建基于预设卷积神经网络的基础图像分割模型；利用多尺度卷积操作对用于进行图像分割的数据集进行特征提取，以得到不同尺度的特征；基于预设深度学习模型架构构建线性注意力机制并利用高斯误差线性单元激活函数作为所述线性注意力机制的构造函数，将所述特征通过所述线性注意力机制进行特征融合，以得到多尺度融合特征图；对所述多尺度融合特征图进行上采样与拼接操作，并为所述基础图像分割模型配置相应的损失函数与优化器以得到目标图像分割模型，以便利用所述目标图像分割模型进行图像分割。通过本申请的技术方案，可以显著提升整体图像分割性能。

技术研发人员：朱克峰,王彦伟,黄伟,李兵兵,宿栋栋
受保护的技术使用者：浪潮（北京）电子信息产业有限公司
技术研发日：
技术公布日：2024/9/23

专利

最新回复(0)