图像检测方法、装置、设备、存储介质及程序产品与流程

xiaoxiao1天前  2


本申请涉及图像处理技术,尤其涉及一种图像检测方法、装置、设备、存储介质及程序产品。


背景技术:

1、对图像中文本区域的自动检测技术,被广泛应用在生活中的各种场景中,为人们的生活提供了便利。例如,在教育和学习中,经常需要对拍摄或截取的图像进行文本内容的提取,可以通过图像扫描软件对图像进行扫描,自动检测出图像中的文本,对文本进行突出显示,便于用户进行快速查看或者对扫描出的文本内容进行复制。


技术实现思路

1、本申请提供一种图像检测方法、装置、设备、存储介质及程序产品,用以提高文本区域的检测精度。

2、第一方面,本申请提供一种图像检测方法,包括:

3、对待检测图像进行特征提取,得到所述待检测图像的第一特征向量,所述第一特征向量用于指示所述文本区域的位置信息、形状信息、以及所述待检测图像中每一像素点属于所述文本区域的概率;

4、基于所述第一特征向量,对所述待检测图像进行图像分割处理,得到所述文本区域的图像。

5、第二方面,本申请提供一种图像文本检测模型的训练方法,包括:

6、获取样本数据集;其中,所述样本数据集中包括样本图像和图像标签,所述图像标签表征样本图像中文本区域的位置信息和形状信息;

7、将所述样本图像输入至初始模型中,得到预测特征向量;

8、根据所述图像标签、所述预测特征向量和损失函数,对所述初始图像文本检测模型进行训练,得到图像文本检测模型。

9、第三方面,本申请提供一种图像检测装置,包括:

10、第一处理单元,用于对待检测图像进行特征提取,得到所述待检测图像的第一特征向量,所述第一特征向量用于指示所述文本区域的位置信息、形状信息、以及所述待检测图像中每一像素点属于所述文本区域的概率;

11、第二处理单元,用于基于所述第一特征向量,对所述待检测图像进行图像分割处理,得到所述文本区域的图像。

12、第四方面,本申请提供一种图像文本检测模型的训练装置,包括:

13、数据集获取单元,用于获取样本数据集;其中,所述样本数据集中包括样本图像和图像标签,所述图像标签表征样本图像中文本区域的位置信息和形状信息;

14、图像输入单元,用于将所述样本图像输入至初始图像文本检测模型中,得到预测特征向量;

15、模型训练单元,用于根据所述图像标签、所述预测特征向量和损失函数,对所述初始图像文本检测模型进行训练,得到图像文本检测模型。

16、第五方面,本申请提供一种电子设备,包括:处理器,以及与所述处理器通信连接的存储器;

17、所述存储器存储计算机执行指令;

18、所述处理器执行所述存储器存储的计算机执行指令,以实现如本申请第一方面和第二方面所述的方法。

19、第六方面,本申请提供一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机执行指令,所述计算机执行指令被处理器执行时用于实现如本申请第一方面和第二方面所述的方法。

20、第七方面,本申请提供一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现如本申请第一方面和第二方面所述的方法。

21、本申请提供的一种图像检测方法、装置、设备、存储介质及程序产品,在需要对待检测图像进行文本区域的检测时,先对待检测图像进行特征提取处理,得到第一特征向量,第一特征向量用于指示文本区域的位置信息、形状信息、以及待检测图像中每一像素点属于文本区域的概率,再根据提取出的第一特征向量进行图像分割处理,分割出待检测图像中的文本区域。通过文本区域的位置信息和形状信息,实现了对于不同位置、不同形状的文本区域进行准确提取,增加了对空间位置信息的感知能力;通过确定待检测图像中每一像素点属于文本区域的概率,确定更有可能属于文本区域的部分,大幅降低了后续分割的冗余信息,实现了对有效区域的筛选,可以更好地分割文本图像,提高文本区域的检测精度。



技术特征:

1.一种图像检测方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述对待检测图像进行特征提取,得到所述待检测图像的第一特征向量,包括:

3.根据权利要求2所述的方法,其特征在于,所述特征提取网络包括特征金字塔网络和特征选择网络;所述通过特征提取网络对所述待检测图像进行特征提取,得到所述待检测图像的第一特征向量,包括:

4.根据权利要求3所述的方法,其特征在于,所述特征选择网络对所述第二特征向量进行特征提取处理,得到第三特征向量,包括:

5.根据权利要求3所述的方法,其特征在于,所述根据所述第三特征向量,确定所述待检测图像中的像素点属于文本区域的概率,包括:

6.根据权利要求3所述的方法,其特征在于,所述根据所述第三特征向量和所述待检测图像中的像素点属于文本区域的概率,确定所述第一特征向量,包括:

7.根据权利要求2所述的方法,其特征在于,所述图像分割网络中包括n个图像分割模块;所述基于所述第一特征向量对所述待检测图像进行图像分割处理,得到所述文本区域的图像,包括:

8.一种图像文本检测模型的训练方法,其特征在于,包括:

9.根据权利要求8所述的方法,其特征在于,根据所述图像标签、所述预测特征向量和损失函数,对所述初始图像文本检测模型进行训练,得到图像文本检测模型,包括:

10.根据权利要求9所述的方法,其特征在于,所述根据所述图像标签表征的文本区域的位置信息和形状信息,确定图像标签中每一像素点属于文本区域的概率,包括:

11.根据权利要求10所述的方法,其特征在于,所述根据图像标签表征的文本区域的位置信息、形状信息,确定所述图像标签中每一像素点与文本框边界之间的目标距离,包括:

12.根据权利要求11所述的方法,其特征在于,所述根据所述文本区域的位置信息、形状信息、每一像素点属于文本区域的概率、所述预测特征向量和损失函数,对所述初始图像文本检测模型进行训练,得到所述图像文本检测模型,包括:

13.一种图像检测装置,其特征在于,包括:

14.一种图像文本检测模型的训练装置,其特征在于,包括:

15.一种电子设备,包括:处理器,以及与所述处理器通信连接的存储器;

16.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有计算机执行指令,所述计算机执行指令被处理器执行时用于实现如权利要求1至7中任一项所述的图像检测方法,或者,用于实现如权利要求8至12中任一项所述的图像文本检测模型的训练方法。

17.一种计算机程序产品,其特征在于,包括计算机程序,该计算机程序被处理器执行时实现权利要求1至7中任一项所述的图像检测方法,或者,实现如权利要求8至12中任一项所述的图像文本检测模型的训练方法。


技术总结
本申请提供一种图像检测方法、装置、设备、存储介质及程序产品。图像检测方法包括:对待检测图像进行特征提取,得到所述待检测图像的第一特征向量,所述第一特征向量用于指示所述待检测图像的文本区域的位置信息、形状信息、以及所述待检测图像中每一像素点属于所述文本区域的概率;基于所述第一特征向量,对所述待检测图像进行图像分割处理,得到所述文本区域的图像。本申请能够提高文本区域的检测精度。

技术研发人员:杨烨
受保护的技术使用者:马上消费金融股份有限公司
技术研发日:
技术公布日:2024/9/23

最新回复(0)