文本检测方法、装置、计算机设备及计算机存储介质与流程

xiaoxiao22天前  22


本申请涉及计算机,尤其涉及一种文本检测方法、装置、计算机设备及计算机存储介质。


背景技术:

1、图像作为当下各类宣传文本的主要载体,可以被用于在各行各业向人们推广产品,因而计算机技术领域内用于制作宣传图册的程序产品应运而生,极大地提升了人们推广相关信息的便捷度,使得海量质量参差不齐的宣传图像涌入互联网。有鉴于此,如何从海量的宣传图像中进行图像筛选,以保留包含优质文本的宣传图像而摒弃包含劣质文本的宣传图像就变得十分必要。为了便于对图像筛选结果的核实,在图像筛选中设立有一个重要环节,便是从图像中定位出劣质文本的具体位置。然而,针对需要从宣传图像中检测是否存在劣质文本内容的场景,传统的文本检测方法较难识别出准确的文本内容,进而也就使得该方法无法准确地确定出劣质文本在图像中的具体位置,极大地限制了传统图像识别方法的应用场景。那么,如何提升计算机设备对图像中目标文本的检测准确度,便成为了当下的研究热点。


技术实现思路

1、本申请实施例提供了一种文本检测方法、装置、计算机设备及计算机存储介质,可提升计算机设备对图像中目标文本的检测准确度。

2、一方面,本申请实施例提供了一种文本检测方法,包括:

3、获取检测图像及检测文本;

4、通过对所述检测图像进行字符识别,在所述检测图像中确定一个或多个文本检测框,每个文本检测框用于指示所述检测图像所包含的文本内容中的至少一条文本语句;

5、在所述检测图像中对所述每个文本检测框对应的区域进行字符识别,从所述每个文本检测框中确定一个或多个文本识别框,及每个文本识别框的描述信息;其中,每个文本识别框用于指示相应文本检测框所指示的至少一条文本语句中的一个或多个文本词;

6、根据每个文本检测框指示的文本语句的语义信息,所述检测文本的语义信息以及所述每个文本检测框中每个文本识别框的描述信息,从所述至少一个文本检测框中确定出目标文本检测框,并在所述检测图像中标记所述目标文本检测框,标记的目标文本检测框用于指示所述检测文本在所述检测图像的位置。

7、再一方面,本申请实施例提供了一种文本检测装置,包括:

8、获取单元,用于获取检测图像及检测文本;

9、第一识别单元,用于通过对所述检测图像进行字符识别,在所述检测图像中确定一个或多个文本检测框,每个文本检测框用于指示所述检测图像所包含的文本内容中的至少一条文本语句;

10、第二识别单元,用于在所述检测图像中对所述每个文本检测框对应的区域进行字符识别,从所述每个文本检测框中确定一个或多个文本识别框,及每个文本识别框的描述信息;其中,每个文本识别框用于指示相应文本检测框所指示的至少一条文本语句中的一个或多个文本词;

11、确定单元,用于根据每个文本检测框指示的文本语句的语义信息,所述检测文本的语义信息以及所述每个文本检测框中每个文本识别框的描述信息,从所述至少一个文本检测框中确定出目标文本检测框,并在所述检测图像中标记所述目标文本检测框,标记的目标文本检测框用于指示所述检测文本在所述检测图像的位置。

12、再一方面,本申请实施例提供了一种计算机设备,包括:

13、处理器,所述处理器用于实现一条或多条计算机程序;

14、计算机存储介质,所述计算机存储介质存储有一条或多条计算机程序,所述一条或多条计算机程序适于由所述处理器加载并实现如第一方面的文本检测方法。

15、再一方面,本申请实施例提供了一种计算机存储介质,所述计算机存储介质存储有一条或多条计算机程序,所述一条或多条计算机程序适于由处理器加载并实现如第一方面的文本检测方法。

16、再一方面,本申请实施例提供了一种程序产品,该程序产品包括计算机程序,所述计算机程序适于由处理器加载并执行如第一方面的文本检测方法。

17、在本申请实施例中,计算机设备在从检测图像中确定检测文本时,执行了多次字符识别。第一次字符识别是基于检测图像进行的,用于确定一个或多个文本检测框,以采用文本检测框指示检测图像所包含的文本内容中的一条或多条文本语句,进而使得计算机设备可以利用文本检测框指示的文本语句的语义信息与检测文本的文本语义信息文本语句之间的语义相似度,来从一个或多个文本检测框中筛选出可能存在检测文本的文本检测框。第二次字符识别用于对文本检测框中的文本语句进行更加精细的拆分,以得到一个或多个文本识别框,以及每个文本识别框的描述信息。而实际应用中,针对同一段文本(如检测文本)确定出的各个文本识别框的描述信息之间是相似的,使得本申请实施例可以基于文本识别框的描述信息判定该文本检测框所指示的文本语句是否属于同一段文本。基于此不难理解,本申请实施例在从检测图像中确定目标文本检测框时,同时参考文本之间的语义信息以及文本检测框中的文本语句是否属于同一段文本,可以丰富计算机设备执行文本检测时所参考的信息,实现从多个角度确定检测文本所在的文本检测框,从而可以提升计算机设备确定出的目标文本检测框的准确度,而目标文本检测框用于指示检测文本,因而使得计算机设备从检测图像中确定出的检测文本的准确度也可以得到提升。



技术特征:

1.一种文本检测方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述根据每个文本检测框指示的文本语句的语义信息,所述检测文本的语义信息以及所述每个文本检测框中每个文本识别框的描述信息,从所述至少一个文本检测框中确定出目标文本检测框,包括:

3.根据权利要求2所述的方法,其特征在于,所述描述信息包含位置信息;所述根据每个候选文本检测框中每个文本识别框的描述信息,从确定出的候选文本检测框中选取所述目标文本检测框,包括:

4.根据权利要求2所述的方法,其特征在于,所述描述信息包含尺寸信息,所述尺寸信息至少用于指示相应文本识别框的长度;所述根据每个候选文本检测框中每个文本识别框的描述信息,从确定出候选文本检测框中选取所述目标文本检测框,包括:

5.根据权利要求2所述的方法,其特征在于,所述描述信息包含位置信息以及尺寸信息,所述位置信息用于指示相应文本识别框在所述检测图像中的位置,所述尺寸信息至少用于指示相应文本识别框的宽度;所述根据每个候选文本检测框中每个文本识别框的描述信息,从确定出候选文本检测框中选取所述目标文本检测框,包括:

6.根据权利要求1所述的方法,其特征在于,获取所述检测文本的方式包括:

7.根据权利要求1所述的方法,其特征在于,获取所述检测文本的方式包括:

8.一种文本检测装置,其特征在于,包括:

9.一种计算机设备,其特征在于,包括:

10.一种计算机存储介质,其特征在于,所述计算机存储介质存储有一条或多条计算机程序,所述一条或多条计算机程序适于由处理器加载并实现如权利要求1-7任一项所述的文本检测方法。


技术总结
本申请公开了一种文本检测方法、装置、计算机设备及计算机存储介质,可以提升确定出的检测文本的位置的准确度。其中,方法包括:获取检测图像及检测文本,以在检测图像中确定一个或多个文本检测框,进而通过对每个文本检测框对应的区域进行字符识别,从每个文本检测框中确定一个或多个文本识别框及每个文本识别框的描述信息,最终使得本申请可根据每个文本检测框指示的文本语句的语义信息,检测文本的语义信息及每个文本识别框的描述信息,从至少一个文本检测框中确定出目标文本检测框。那么,在检测图像中标记目标文本检测框,便可采用标记的目标文本检测框来指示检测文本在检测图像的位置。

技术研发人员:郑少胤
受保护的技术使用者:腾讯科技(深圳)有限公司
技术研发日:
技术公布日:2024/9/23

最新回复(0)