一种文本截图识别方法、系统、设备及计算机存储介质与流程

xiaoxiao6月前 42

本申请涉及计算机，更具体地说，涉及一种文本截图识别方法、系统、设备及计算机存储介质。

背景技术：

1、当前，在文本变化频率较快时，可以通过对文本进行截图来保存文本信息，之后对截图进行识别来解析得到文本信息，比如通过图片识别模型对截图进行识别和文本转换来得到对应的文本信息。然而，通过图片识别模型截图进行处理后所得文本信息存在结构混乱的现象，导致识别准确性差。

2、综上所述，如何提高对文本截图的识别准确性是目前本领域技术人员亟待解决的问题。

技术实现思路

1、本申请的目的是提供一种文本截图识别方法，其能在一定程度上解决如何提高对文本截图的识别准确性的技术问题。本申请还提供了一种文本截图识别系统、电子设备及计算机可读存储介质。

2、为了实现上述目的，本申请提供如下技术方案：

3、一种文本截图识别方法，包括：

4、获取对目标文本进行截图后所得的目标图像；

5、对所述目标图像进行文本识别，得到第一文本识别结果；

6、在所述第一文本识别结果中，将属于同行的第一文本组合在一起，得到第二文本识别结果；

7、对所述第二文本识别结果中的第二文本进行矫正，得到所述目标图像的目标文本识别结果；

8、其中，所述矫正包括字符拼接，和/或字符补齐，和/或字符纠错。

9、在一示例性实施例中，所述在所述第一文本识别结果中，将属于同行的第一文本组合在一起，得到第二文本识别结果，包括：

10、在所述第一文本识别结果中，确定出各个第一文本在所述目标图像中的文本框坐标；

11、选取一个未被标记的第一文本作为当前文本；

12、确定当前文本的文本框坐标的最小y坐标、最大y坐标和中间y坐标；

13、在除当前文本的其他第一文本中，选取一个未选取过的文本作为待处理文本；

14、确定待处理文本的文本框坐标的最小y坐标、最大y坐标和中间y坐标；

15、根据最小y坐标、最大y坐标和中间y坐标，检测当前文本的文本框坐标与待处理文本的文本框坐标是否相同；

16、若相同，则将当前文本和待处理文本进行组合，得到组合结果；

17、判断是否还有未被选取的其他第一文本；

18、若还有未被选取的其他第一文本，则返回执行所述在除当前文本的其他第一文本中，选取一个未选取过的文本作为待处理文本的步骤；

19、若其他第一文本均被选取过，则对当前文本进行标记，判断是否还有未标记的第一文本；

20、若还有未标记的第一文本，则返回执行所述选取一个未被标记的第一文本作为当前文本的步骤；

21、若所有第一文本均被标记，则将组合结果和未被组合的第一文本作为所述第二文本识别结果。

22、在一示例性实施例中，所述根据最小y坐标、最大y坐标和中间y坐标，检测当前文本的文本框坐标与待处理文本的文本框坐标是否相同，包括：

23、响应于最小y坐标间的差值、最大y坐标间的差值、中间y坐标间的差值均小于设定值，则确定当前文本的文本框坐标与待处理文本的文本框坐标相同；

24、其中，所述设定值小于等于所述目标文本的行间距。

25、在一示例性实施例中，所述对所述第二文本识别结果中的第二文本进行矫正，包括：

26、对所述目标文本的字符进行分析，得到字符特征；

27、根据所述字符特征对所述第二文本识别结果中的第二文本进行矫正。

28、在一示例性实施例中，所述根据所述字符特征对所述第二文本识别结果中的第二文本进行矫正，包括：

29、对于所述第二文本识别结果中的第二文本，检测所述第二文本的字符是否符合所述字符特征；

30、将所述第二文本中不符合所述结构特征的字符确定为待处理字符；

31、判断相邻的所述待处理字符组合后是否符合所述字符特征；

32、若相邻的所述待处理字符组合后符合所述字符特征，则将相邻的所述待处理字符拼接在一起。

33、在一示例性实施例中，所述根据所述字符特征对所述第二文本识别结果中的第二文本进行矫正，包括：

34、对于所述第二文本识别结果中的第二文本，根据所述字符特征识别出所述第二文本中的缺失字符并进行补齐。

35、在一示例性实施例中，对所述第二文本识别结果中的第二文本进行矫正，包括：

36、对所述第二文本识别结果中的第二文本进行分隔符纠错。

37、一种文本截图识别系统，包括：

38、第一获取模块，用于获取对目标文本进行截图后所得的目标图像；

39、第一识别模块，用于对所述目标图像进行文本识别，得到第一文本识别结果；

40、第一组合模块，用于在所述第一文本识别结果中，将属于同行的第一文本组合在一起，得到第二文本识别结果；

41、第一矫正模块，用于对所述第二文本识别结果中的第二文本进行矫正，得到所述目标图像的目标文本识别结果；

42、其中，所述矫正包括字符拼接，和/或字符补齐，和/或字符纠错。

43、一种电子设备，包括：

44、存储器，用于存储计算机程序；

45、处理器，用于执行所述计算机程序时实现如上任一所述文本截图识别方法的步骤。

46、一种计算机可读存储介质，所述计算机可读存储介质中存储有计算机程序，所述计算机程序被处理器执行时实现如上任一所述文本截图识别方法的步骤。

47、本申请提供的一种文本截图识别方法，获取对目标文本进行截图后所得的目标图像；对目标图像进行文本识别，得到第一文本识别结果；在第一文本识别结果中，将属于同行的第一文本组合在一起，得到第二文本识别结果；对第二文本识别结果中的第二文本进行矫正，得到目标图像的目标文本识别结果；其中，矫正包括字符拼接，和/或字符补齐，和/或字符纠错。本申请在对目标图像进行文本识别得到第一文本识别结果之后，可以将属于同行的第一文本组合在一起，以避免文本识别出现文本换行的错误，且之后可以对第二文本进行字符拼接和/或字符补齐和/或字符纠错，以缩减目标文本识别结果与目标文本间的差距，提高文本截图的识别准确性。本申请提供的一种文本截图识别系统、电子设备及计算机可读存储介质也解决了相应技术问题。

技术特征：

1.一种文本截图识别方法，其特征在于，包括：

2.根据权利要求1所述的方法，其特征在于，所述在所述第一文本识别结果中，将属于同行的第一文本组合在一起，得到第二文本识别结果，包括：

3.根据权利要求2所述的方法，其特征在于，所述根据最小y坐标、最大y坐标和中间y坐标，检测当前文本的文本框坐标与待处理文本的文本框坐标是否相同，包括：

4.根据权利要求1所述的方法，其特征在于，所述对所述第二文本识别结果中的第二文本进行矫正，包括：

5.根据权利要求4所述的方法，其特征在于，所述根据所述字符特征对所述第二文本识别结果中的第二文本进行矫正，包括：

6.根据权利要求4所述的方法，其特征在于，所述根据所述字符特征对所述第二文本识别结果中的第二文本进行矫正，包括：

7.根据权利要求1所述的方法，其特征在于，对所述第二文本识别结果中的第二文本进行矫正，包括：

8.一种文本截图识别系统，其特征在于，包括：

9.一种电子设备，其特征在于，包括：

10.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质中存储有计算机程序，所述计算机程序被处理器执行时实现如权利要求1至7任一项所述文本截图识别方法的步骤。

技术总结
本申请公开了一种文本截图识别方法、系统、设备及计算机存储介质，涉及计算机技术领域，获取对目标文本进行截图后所得的目标图像；对目标图像进行文本识别，得到第一文本识别结果；在第一文本识别结果中，将属于同行的第一文本组合在一起，得到第二文本识别结果；对第二文本识别结果中的第二文本进行矫正，得到目标图像的目标文本识别结果；其中，矫正包括字符拼接，和/或字符补齐，和/或字符纠错。本申请可以将属于同行的第一文本组合在一起，以避免文本识别出现文本换行的错误，且之后可以对第二文本进行字符拼接和/或字符补齐和/或字符纠错，以缩减目标文本识别结果与目标文本间的差距，提高文本截图的识别准确性。

技术研发人员：刘瑞,张金鹏,李明凯
受保护的技术使用者：苏州元脑智能科技有限公司
技术研发日：
技术公布日：2024/9/23

专利

最新回复(0)