识别图像中的字符的方法及装置的制造方法

xiaoxiao2020-10-23  17

识别图像中的字符的方法及装置的制造方法
【技术领域】
[0001] 本公开涉及图像识别技术领域,尤其涉及一种识别图像中的字符的方法及装置。
【背景技术】
[0002] 在对诸如印刷数字进行识别时,需要对数字进行特征提取。在对数字进行特征提 取前,需要对图像进行相应的预处理,从而使数字的特征提取能更加顺利或使得数字的特 征能更好地显露出,梯度算子是相关技术中对图像进行预处理时的一个重要手段,然而,梯 度算子在对图像进行预处理时,计算量较大。

【发明内容】

[0003] 为克服相关技术中存在的问题,本公开实施例提供一种识别图像中的字符的方法 及装置,用以降低字符识别过程中的计算量。
[0004] 根据本公开实施例的第一方面,提供一种识别图像中的字符的方法,包括:
[0005] 确定所述图像中所包含的字符的第一个数;
[0006] 将所述图像中所包含的字符分割为所述第一个数的字符图片;
[0007] 将所述字符图片沿着设定大小的窗口滑动从而将所述字符图片分割成第二个数 的图片单元;
[0008] 根据所述第二个数的图片单元内的非零像素点的个数识别所述图像中的字符。
[0009] 在一实施例中,所述方法还可包括:
[0010] 对所述图像进行边缘增强并二值化,得到二值化后的图像;之后,执行所述确定所 述图像中所包含的字符的个数的步骤。
[0011] 在一实施例中,所述方法还包括:
[0012] 从二值化后的所述图像的水平方向与竖直方向确定所述第一个数的字符在所述 图像中的梯度;
[0013] 通过所述梯度确定所述字符在所述水平方向与所述竖直方向的边界;之后,执行 所述根据所述水平边界和所述竖直边界将所述图像中所包含的字符分割为所述第一个数 的字符图片的步骤。
[0014] 在一实施例中,所述根据所述第二个数的图片单元内的非零像素点的个数识别所 述图像中的字符,可包括:
[0015] 依据窗口滑动顺序统计所述第二个数的图片单元中的每一个图片单元所包含的 第一组非零像素点的个数;
[0016] 依据窗口滑动顺序统计字符数据库中的每一个字符的模板对应的模板单元的分 辨率大小的第二组非零像素点的个数;
[0017] 根据所述第一组非零像素点的个数和所述第二组非零像素点的个数识别所述图 像中的字符。
[0018] 在一实施例中,所述根据所述第一组非零像素点的个数和所述第二组非零像素点 的个数识别所述图像中的字符,可包括:
[0019] 依据窗口滑动顺序统计所述第一组非零像素点的个数与所述第二组非零像素点 的个数的差值的绝对值;
[0020] 确定所述第二个数的绝对值的和值中的最小值对应的字符模板;
[0021] 将所述最小值对应的字符模板对应的字符识别为所述字符图片中的字符。
[0022] 根据本公开实施例的第二方面,提供一种识别图像中的字符的装置,包括:
[0023] 第一确定模块,被配置为确定所述图像中所包含的字符的第一个数;
[0024] 第一分割模块,被配置为将所述图像中所包含的字符分割为所述第一确定模块确 定的所述第一个数的字符图片;
[0025] 第二分割模块,被配置为将所述第一分割模块分割得到的所述字符图片沿着设定 大小的窗口滑动从而将所述字符图片分割成第二个数的图片单元;
[0026] 识别模块,被配置为根据所述第二分割模块分割得到的所述第二个数的图片单元 内的非零像素点的个数识别所述图像中的字符。
[0027] 在一实施例中,所述装置还可包括:
[0028] 图像预处理模块,被配置为对所述图像进行边缘增强并二值化,得到二值化后的 图像;之后,所述第一确定模块执行所述确定所述图像中所包含的字符的第一个数的步骤。
[0029] 在一实施例中,所述装置还可包括:
[0030] 第二确定模块,被配置为从所述图像预处理模块二值化后的所述图像的水平方向 与竖直方向确定所述第一个数的字符在所述图像中的梯度;
[0031] 第三确定模块,被配置为通过所述第二确定模块确定的所述梯度确定所述字符在 所述水平方向与所述竖直方向的边界;之后,所述第一分割模块执行所述根据所述水平边 界和所述竖直边界将所述图像中所包含的字符分割为所述第一个数的字符图片的步骤。
[0032] 在一实施例中,所述识别模块可包括:
[0033] 第一统计子模块,被配置为依据窗口滑动顺序统计所述第二分割模块分割后的所 述第二个数的图片单元中的每一个图片单元所包含的第一组非零像素点的个数;
[0034] 第二统计子模块,被配置为依据窗口滑动顺序统计字符数据库中的每一个字符的 模板对应的模板单元的分辨率大小的第二组非零像素点的个数;
[0035] 第一识别子模块,被配置为根据所述第一统计子模块统计得到的所述第一组非零 像素点的个数和所述第二统计子模块统计得到的所述第二组非零像素点的个数识别所述 图像中的字符。
[0036] 在一实施例中,所述第一识别子模块可包括:
[0037] 计算子模块,被配置为依据窗口滑动顺序统计所述第一组非零像素点的个数与所 述第二组非零像素点的个数的差值的绝对值;
[0038] 确定子模块,被配置为确定所述计算子模块计算得到的所述第二个数的绝对值的 和值中的最小值对应的字符模板;
[0039] 第二识别子模块,被配置为将所述确定子模块确定的所述最小值对应的字符模板 对应的字符识别为所述字符图片中的字符。
[0040] 根据本公开实施例的第三方面,提供一种识别图像中的字符的装置,包括:
[0041] 处理器;
[0042] 用于存储处理器可执行指令的存储器;
[0043] 其中,所述处理器被配置为:
[0044] 确定所述图像中所包含的字符的第一个数;
[0045] 将所述图像中所包含的字符分割为所述第一个数的字符图片;
[0046] 将所述字符图片沿着设定大小的窗口滑动从而将所述字符图片分割成第二个数 的图片单元;
[0047] 根据所述第二个数的图片单元内的非零像素点的个数识别所述图像中的字符。
[0048] 本公开的实施例提供的技术方案可以包括以下有益效果:由于印刷字符在水平方 向与竖直方向均存在很强的边缘,并且在字符图片的分辨率确定的情况下,设定字符的非 零像素点的个数较为固定,因此通过第二个数的图片单元内的非零像素点的个数识别图像 中的字符可以简化字符识别过程中的复杂度,降低字符识别过程中的计算量,增强了字符 识别时的鲁棒性。
[0049] 应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不 能限制本公开。
【附图说明】
[0050] 此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本发明的实施 例,并与说明书一起用于解释本发明的原理。
[0051] 图1A是根据一示例性实施例示出的识别图像中的字符的方法的流程图。
[0052] 图1B是根据一示例性实施例示出的图像的示意图。
[0053] 图1C是根据一示例性实施例示出的字符图片的示意图。
[0054] 图1D是根据一示例性实施例示出的图片单元的示意图。
[0055] 图1E是根据一示例性实施例一示出的二值化后的字符图片的示意图。
[0056] 图2是根据一示例性实施例一示出的识别图像中的字符的方法的流程图。
[0057] 图3A是根据一示例性实施例二示出的识别图像中的字符的方法的流程图。
[0058] 图3B是根据一示例性实施例二示出的步骤S304的流程图。
[0059] 图4是根据一示例性实施例示出的一种识别图像中的字符的装置的框图。
[0060] 图5是根据一示例性实施例示出的另一种识别图像中的字符的装置的框图。
[0061] 图6是根据一示例性实施例示出的一种适用于识别图像中的字符的装置的框图。
【具体实施方式】
[0062] 这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及 附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例 中所描述的实施方式并不代表与本发明相一致的所有实施方式。相反,它们仅是与如所附 权利要求书中所详述的、本发明的一些方面相一致的装置和方法的例子。
[0063] 图1A是根据一示例性实施例示出的识别图像中的字符的方法的流程图,图1B是 根据一示例性实施例示出的图像的示意图,图1C是根据一示例性实施例示出的 字符图片 的示意图,图1D是根据一示例性实施例示出的图片单元的示意图,图1E是根据一示例性实 施例一示出的二值化后的字符图片的示意图;该识别图像中的字符的方法可以应用在终端 设备(例如:智能手机、平板电脑、台式计算机)上,可以通过在终端设备上安装应用的方式 或者在台式计算机上安装软件的方式实现,如图1A所示,该识别图像中的字符的方法包括 以下步骤S101-S104 :
[0064]在步骤S101中,确定图像中所包含的字符的第一个数。
[0065] 在一实施例中,图像中所包含的字符可以为数字,也可以为英文字母,还可以为希 腊字母,本公开对字符的具体类型不做限制。如图1B所示,图像10中所包含的身份证号的 部分数字。
[0066] 在步骤S102中,将图像中所包含的字符分割为第一个数的字符图片。
[0067] 在一实施例中,可以采用图像分割技术将图像中的数字分割为单个的包含一个字 符的字符图片,例如,可以在检测到字符的左右边沿和上下边沿部分,从而沿着左右边沿和 上下边沿将字符图片从图像中分割出来,例如,通过对图像10沿着数字"9"的左右边沿和 上下边沿识别梯度,从而可以将数字"9"从图像10中分割出来,得到图1C所示的字符图片 11。在一实施例中,可以通过将图像进行二值化处理,再识别二值化后的图像中的字符的边 沿部分,从而将二值化后的字符从图像中分割出来,例如,通过将图像10进行二值化处理 后,识别图像10中的数字的边沿部分,依据边沿将数字"9"从二值化后的图像10中分割出 来,形成图1D所示的二值化后的字符图片12。
[0068] 在步骤S103中,将字符图片沿着设定大小的窗口滑动从而将字符图片分割成第 二个数的图片单元。
[0069] 在一实施例中,设定大小的窗口可以根据字符图片的分辨率来定,例如,字符图片 的分辨率为48*48,则设定大小的窗口可以设置为4*4,即窗口的大小应以能够在字符图片 上滑动为准,在一实施例中,窗口滑动的幅度可以确保相邻窗口之间有重叠,例如,第一个 窗口滑动到了字符图片11的1至4行,1至4列,得到了图1E所示的图片单元13,第二个 窗口可以为字符图片11的3至6行,1至4列等,从而在相同行数上滑动的过程中确保顺次 得到的图片单元之间具有重叠的像素点。
[0070] 在步骤S104中,根据第二个数的图片单元内的非零像素点的个数识别图像中的 字符。
[0071] 在一实施例中,可以将第二个数的图片单元内的非零像素点的个数与字符数据库 中的字符模板对应的模板单元的非零像素点的个数进行比较,将两个非零像素点的个数的 差值最小的字符识别为字符图片中的字符,例如,将字符图片中的"9"分割为第二个数的图 片单元,将字符数据库中的与图片单元具有相同分辨率的字符模板也分割为与图片单元相 同分辨率的模板单元,将相同窗口位置的图片单元内的非零像素点的个数与模板单元内的 非零像素点的个数求差值的绝对值,并将第二个数的差值的绝对值求和,将字符图片11与 字符数据库中的字符的差值的绝对值的和值最小的字符模板识别为与字符图片对应的字 符,例如,经过上述计算,确定字符数据库中的字符模板"9"与字符图片11对应的差值的绝 对值的和值最小,则将字符图片11中的字符识别为"9"。
[0072] 本实施例中,由于印刷字符在水平方向与竖直方向均存在很强的边缘,并且在字 符图片的分辨率确定的情况下,设定字符的非零像素点的个数较为固定,因此通过第二个 数的图片单元内的非零像素点的个数识别图像中的字符可以简化字符识别过程中的复杂 度,降低字符识别过程中的计算量,增强了字符识别时的鲁棒性。
[0073] 在一实施例中,方法还可包括:
[0074] 对图像进行边缘增强并二值化,得到二值化后的图像;之后,执行确定图像中所包 含的字符的个数的步骤。
[0075] 在一实施例中,方法还包括:
[0076] 从二值化后的图像的水平方向与竖直方向确定第一个数的字符在图像中的梯 度;
[0077] 通过梯度确定字符在水平方向与竖直方向的边界;之后,执行根据水平边界和竖 直边界将图像中所包含的字符分割为第一个数的字符图片的步骤。
[0078] 在一实施例中,根据第二个数的图片单元内的非零像素点的个数识别图像中的字 符,可包括:
[0079] 依据窗口滑动顺序统计第二个数的图片单元中的每一个图片单元所包含的第一 组非零像素点的个数;
[0080] 依据窗口滑动顺序统计字符数据库中的每一个字符的模板对应的模板单元的分 辨率大小的第二组非零像素点的个数;
[0081] 根据第一组非零像素点的个数和第二组非零像素点的个数识别图像中的字符。
[0082] 在一实施例中,根据第一组非零像素点的个数和第二组非零像素点的个数识别图 像中的字符,可包括:
[0083] 依据窗口滑动顺序统计第一组非零像素点的个数与第二组非零像素点的个数的 差值的绝对值;
[0084] 确定第二个数的绝对值的和值中的最小值对应的字符模板;
[0085] 将最小值对应的字符模板对应的字符识别为字符图片中的字符。
[0086] 具体如何识别图像中的字符的,请参考后续实施例。
[0087] 至此,本公开实施例提供的上述方法,可以简化字符识别过程中的复杂度,降低字 符识别过程中的计算量,增强了字符识别时的鲁棒性。
[0088] 下面以具体实施例来说明本公开实施例提供的技术方案。
[0089] 图2是根据一示例性实施例一示出的识别图像中的字符的方法的流程图;本实施 例利用本公开实施例提供的上述方法,以如何从图像中分割字符图片为例并结合图1B至 图1E进行示例性说明,如图2所示,包括如下步骤:
[0090] 在步骤S201中,对图像进行边缘增强并二值化,得到二值化后的图像。
[0091] 在一实施例中,可以通过相关技术中对图像进行边缘增强并二值化处理的方法对 图像10进行相应的处理,得到二值化后的图像(图中未视)。
[0092] 在步骤S202中,确定二值化后的图像中所包含的字符的个数。
[0093] 在一实施例中,可以根据对图像进行分割的次数来确定图像中所包含的字符的个 数,例如,在对图像进行粗分割的过程中,在确定相邻字符之间的相邻区域时,即可在该相 邻区域进行分割,并统计分割的次数,得到图像中所包含的字符的个数,以图像10为例,在 图像10中,包含数字"0219860",在识别上述数字的过程中,可以先确定相邻数字的相邻区 域,然后在相邻区域对相邻的数字进行分割,在统计分割次数后,可以确定图像10中所包 含的数字的第一个数为7个。
[0094] 在步骤S203中,从二值化后的图像的水平方向与竖直方向确定第一个数的字符 在图像中的梯度。
[0095] 在步骤S204中,通过梯度确定字符在水平方向与竖直方向的边界,根据水平方向 的边界和竖直方向的边界作为字符图片的边界。
[0096] 在步骤S205中,根据水平边界和竖直边界将图像中所包含的字符分割为第一个 数的字符图片。
[0097] 上述步骤S203至步骤S205中,在一实施例中,可以通过sobel或者canny算子来 确定字符在图像中的梯度,例如,通过sobel算子识别到数字"9"的梯度后,进而可以根据 梯度确定数字"9"的水平边界和竖直边界,通过水平边界和竖直边界即可将数字"9"从图 像10中分割出来,得到如图1C所示的字符图片12,图像中给其它数字的分割方法请参考上 述描述,在此不再详述。
[0098] 在步骤S206中,将字符图片沿着设定大小的窗口滑动从而将字符图片分割成第 二个数的图片单元。
[0099] 步骤S206的描述可以参考上述步骤S103的描述,在此不再详述。
[0100] 在步骤S207中,根据第二个数的图片单元内的非零像素点的个数识别图像中的 字符。
[0101] 步骤S207的描述可以参考上述步骤S104的描述,在此不再详述。
[0102] 本实施例在具有上述实施例的有益技术效果的基础上,通过对图像进行图像增强 以及二值化处理,使字符更易于在图像中识别到,进一步提高了字符识别的准确度,进而达 到了很好的识别效果。
[0103] 图3A是根据一示例性实施例二示出的识别图像中的字符的方法的流程图,图3B 是根据一示例性实施例二示出的步骤S304的流程图;本实施例利用本公开实施例提供的 上述方法,以如何通过非零像素点的个数识别图像中的字符为例并结合图1B至图1E进行 示例性说明,如图3A所示,包括如下步骤:
[0104] 在步骤S301中,确定图像中所包含的字符的第一个数。
[0105] 在步骤S302中,将图像中 所包含的字符分割为第一个数的字符图片。
[0106]在步骤S303中,将字符图片沿着设定大小的窗口滑动从而将字符图片分割成第 二个数的图片单元。
[0107] 步骤S301至步骤S303的描述请参见上述步骤S101至步骤S103,在此不再详述。
[0108] 在步骤S304中,依据窗口滑动顺序统计第二个数的图片单元中的每一个图片单 元所包含的第一组非零像素点的个数。
[0109] 在步骤S305中,依据窗口滑动顺序统计字符数据库中的每一个字符的模板对应 的模板单元的分辨率大小的第二组非零像素点的个数。
[0110] 在步骤S306中,根据第一组非零像素点的个数和第二组非零像素点的个数识别 图像中的字符。
[0111] 在上述步骤S304至步骤S306中,若将字符图片分割成了M个的图片单元,对M个 的图片单元中的每一个图片单元中的非零像素点的个数进行统计,得到第一组非零像素点 的个数,例如,第一组非零像素点的个数为[Nl,N2,N3,N4,…,匪];对字符数据库中的每 一个字符的模板分割为与图片单元相同分辨了的模板单元,得到Ml个模板单元,对Ml个模 板单元中的每一个模板单元中的非零像素点的个数进行统计,得到第二组非零像素点的个 数,例如,第二组非零像素点的个数为[nl,n2,n3,n4,…,nM],其中,M表示图片单元的个 数,nl与N1具有相同的窗□位置,n2与N2具有相同的窗□位置,以此类推,nM与NM具有 相同的窗口位置;通过顺次比较第一组非零像素点的个数与第二组非零像素点的个数,实 现对图像中的字符进行识别。
[0112] 如图3B所示,在一实施例中,步骤S306可包括:
[0113] 在步骤S311中,依据窗口滑动顺序统计第一组非零像素点的个数与第二组非零 像素点的个数的差值的绝对值。
[0114] 在步骤S312中,确定第二个数的绝对值的和值中的最小值对应的字符模板。
[0115] 在步骤S313中,将最小值对应的字符模板对应的字符识别为字符图片中的字符。
[0116] 在上述步骤S311至步骤S313中,例如,计算N1与nl的差值的绝对值|Nl-nl|、N2 与n2的差值的绝对值|N2-n2 |、N3与n3的差值的绝对值|N3-n3 |、…、NM与nM的差值的 绝对值INM-nM|,计算上述的差值的绝对值的和值为
,由于字符数据库中具 有多个(本公开中的第二个数)字符模板,因此上述差值的绝对值的和值也为多个,由此, 从多个和值中确定和值的最小值,例如,字符图片12对应的和值的最小值对应的字符模板 为"9",则可以将字符图片12上的字符识别为数字"9"。
[0117] 本实施例在具有上述实施例的有益技术效果的基础上,通过将图片单元对应的非 零像素值的个数与字符数据库中的每一个字符的模板对应的模板单元中的非零像素点的 个数来识别字符图片中的字符,通过参考字符数据库中的字符的非零像素点的信息,简化 了字符识别过程中的计算复杂度,进一步提高了字符识别的准确度,进而达到了很好的识 别效果。
[0118] 图4是根据一示例性实施例示出的一种识别图像中的字符的装置的框图,如图4 所示,识别图像中的字符的装置包括:
[0119] 第一确定模块41,被配置为确定图像中所包含的字符的第一个数;
[0120] 第一分割模块42,被配置为将图像中所包含的字符分割为第一确定模块41确定 的第一个数的字符图片;
[0121] 第二分割模块43,被配置为将第一分割模块42分割得到的字符图片沿着设定大 小的窗口滑动从而将字符图片分割成第二个数的图片单元;
[0122] 识别模块44,被配置为根据第二分割模块43分割得到的第二个数的图片单元内 的非零像素点的个数识别图像中的字符。
[0123] 图5是根据一示例性实施例示出的另一种识别图像中的字符的装置的框图,如图 5所示,在上述图4所示实施例的基础上,在一实施例中,装置还可包括:
[0124] 图像预处理模块45,被配置为对图像进行边缘增强并二值化,得到二值化后的图 像;之后,第一确定模块41执行确定图像中所包含的字符的第一个数的步骤。
[0125] 在一实施例中,装置还可包括:
[0126] 第二确定模块46,被配置为从图像预处理模块45二值化后的图像的水平方向与 竖直方向确定第一个数的字符在图像中的梯度;
[0127]第三确定模块47,被配置为通过第二确定模块46确定的梯度确定字符在水平方 向与竖直方向的边界;之后,第一分割模块42执行根据水平边界和竖直边界将图像中所包 含的字符分割为第一个数的字符图片的步骤。
[0128] 在一实施例中,识别模块44可包括:
[0129] 第一统计子模块441,被配置为依据窗口滑动顺序统计第二分割模块43分割后的 第二个数的图片单元中的每一个图片单元所包含的第一组非零像素点的个数;
[0130] 第二统计子模块442,被配置为依据窗口滑动顺序统计字符数据库中的每一个字 符的模板对应的模板单元的分辨率大小的第二组非零像素点的个数;
[0131] 第一识别子模块443,被配置为根据第一统计子模块441统计得到的第一组非零 像素点的个数和第二统计子模块442统计得到的第二组非零像素点的个数识别图像中的 字符。
[0132] 在一实施例中,第一识别子模块443可包括:
[0133] 计算子模块4431,被配置为依据窗口滑动顺序统计第一组非零像素点的个数与第 二组非零像素点的个数的差值的绝对值;
[0134] 确定子模块4432,被配置为确定计算子模块计4431算得到的第二个数的绝对值 的和值中的最小值对应的字符模板;
[0135] 第二识别子模块4433,被配置为将确定子模块4432确定的最小值对应的字符模 板对应的字符识别为字符图片中的字符。
[0136] 关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法 的实施例中进行了详细描述,此处将不做详细阐述说明。
[0137] 图6是根据一示例性实施例示出的一种适用于识别图像中的字符的装置的框图。 例如,装置600可以是移动电话,计算机,数字广播终端,消息收发设备,游戏控制台,平板 设备,医疗设备,健身设备,个人数字助理等。
[0138] 参照图6,装置600可以包括以下一个或多个组件:处理组件602,存储器604,电 源组件606,多媒体组件608,音频组件610,输入/输出(I/O)的接口 612,传感器组件614, 以及通信组件616。
[0139] 处理组件602通常控制装置600的整体操作,诸如与显示,电话呼叫,数据通信,相 机操作和记录操作相关联的操作。处理元件602可以包括一个或多个处理器620来执行指 令,以完成上述的方法的全部或部分步骤。此外,处理组件602可以包括一个或多个模块, 便于处理组件602和其他组件之间的交互。例如,处理部件602可以包括多媒体模块,以方 便多媒体组件608和处理组件602之间的交互。
[0140] 存储器604被配置为存储各种类型的数据以支持在装置600的操作。这些数据的 示例包括用于在装置600上操作的任何应用程序或方法的指令,联系人数据,电话簿数据, 消息,图像,视频等。存储器604可以由任何类型的易失性或非易失性存储设备或者它们的 组合实现,如静态随机存取存储器(SRAM),电可擦除可编程只读存储器(EEPR0M),可擦除 可编程只读存储器(EPROM),可编程只读存储器(PR0M),只读存储器(R0M),磁存储器,快闪 存储器,磁盘或光盘。
[0141] 电力组件606为装置600的各种组件提供电力。电力组件606可以包括电源管理 系统,一个或多个电源,及其他与为装置600生成、管理和分配电力相关联的组件。
[0142] 多媒体组件608包括在所述装置600和用户之间的提供一个输出接口的屏幕。在 一些实施例中,屏幕可以包括液晶显示器(LCD)和触摸面板(TP)。如果屏幕包括触摸面板, 屏幕可以被实现为触摸屏,以接收来自用户的输入信号。触摸面板包括一个或多个触摸传 感器以感测触摸、滑动和触摸面板上的手势。所述触摸传感器可以不仅感测触摸或滑动动 作的边界,而且还检测与所述触摸或滑动操作相关的持续时间和压力。在一些实施例中,多 媒体组件608包括一个前置摄像头和/或后置摄像头。当装置600处于操作模式,如拍摄 模式或视频模式时,前置摄像头和/或后置摄像头可以接收外部的多媒体数据。每个前置 摄像头和后置摄像头可以是一个固定的光学透镜系统或具有焦距和光学变焦能力。
[0143] 音频组件610被配置为输出和/或输入音频信号。例如,音频组件610包括一个 麦克风(MIC),当装置600处于操作模式,如呼叫模式、记录模式和语音识别模式时,麦克风 被配置为接收外部音频信号。所接收的音频信号可以被进一步存储在存储器604或经由通 信组件616发送。在一些实施例中,音频组件610还包括一个扬声器,用于输出音频信号。
[0144]I/O接口 612为处理组件602和外围接口模块之间提供接口,上述外围接口模块可 以是键盘,点击轮,按钮等。这些按钮可包括但不限于:主页按钮、音量按钮、启动按钮和锁 定按钮。
[0145] 传感器组件614包括一个或多个传感器,用于为装置600提供各个方面的状态评 估。例如,传感器组件614可以检测到装置600的打开/关闭状态,组件的相对定位,例如 所述组件为装置600的显示器和小键盘,传感器组件614还可以检测装置600或装置600 一个组件的位置改变,用户与装置600接触的存在或不存在,装置600方位或加速/减速和 装置600的温度变化。传感器组件614可以包括接近传感器,被配置用来在没有任何的物 理接触时检测附近物体的存在。传感器组件614还可以包括光传感器,如CMOS或C⑶图像 传感器,用于在成像应用中使用。在一些实施例中,该传感器组件614还可以包括加速度传 感器,陀螺仪传感器,磁传感器,压力传感器或温度传感器。
[0146] 通信组件616被配置为便于装置600和其他设备之间有线或无线方式的通信。装 置600可以接入基于通信标准的无线网络,如WiFi,2G或3G,或它们的组合。在一个示例性 实施例中,通信部件616经由广播信道接收来自外部广播管理系统的广播信号或广播相关 信息。在一个示例性实施例中,所述通信部件616还包括近场通信(NFC)模块,以促进短程 通信。例如,在NFC模块可基于射频识别(RFID)技术,红外数据协会(IrDA)技术,超宽带 (UWB)技术,蓝牙(BT)技术和其他技术来实现。
[0147] 在示例性实施例中,装置600可以被一个或多个应用专用集成电路(ASIC)、数字 信号处理器(DSP)、数字信号处理设备(DSPD)、可编程逻辑器件(PLD)、现场可编程门阵列 (FPGA)、控制器、微控制器、微处理器或其他电子元件实现,用于执行上述方法。
[0148] 在示例性实施例中,还提供了一种包括指令的非临时性计算机可读存储介质,例 如包括指令的存储器604,上述指令可由装置600的处理器620执行以完成上述方法。例 如,所述非临时性计算机可读存储介质可以是R0M、随机存取存储器(RAM)、CD-ROM、磁带、 软盘和光数据存储设备等。
[0149] 本领域技术人员在考虑说明书及实践这里公开的公开后,将容易想到本公开的其 它实施方案。本申请旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或 者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识 或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由下面的 权利要求指出。
[0150] 应当理解的是,本公开并不局限于上面已经描述并在附图中示出的精确结构,并 且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。
【主权项】
1. 一种识别图像中的字符的方法,其特征在于,所述方法包括: 确定所述图像中所包含的字符的第一个数; 将所述图像中所包含的字符分割为所述第一个数的字符图片; 将所述字符图片沿着设定大小的窗口滑动从而将所述字符图片分割成第二个数的图 片单元; 根据所述第二个数的图片单元内的非零像素点的个数识别所述图像中的字符。2. 根据权利要求1所述的方法,其特征在于,所述方法还包括: 对所述图像进行边缘增强并二值化,得到二值化后的图像;之后,执行所述确定所述图 像中所包含的字符的第一个数的步骤。3. 根据权利要求2所述的方法,其特征在于,所述方法还包括: 从二值化后的所述图像的水平方向与竖直方向确定所述第一个数的字符在所述图像 中的梯度; 通过所述梯度确定所述字符在所述水平方向与所述竖直方向的边界;之后,执行所述 根据所述水平边界和所述竖直边界将所述图像中所包含的字符分割为所述第一个数的字 符图片的步骤。4. 根据权利要求1所述的方法,其特征在于,所述根据所述第二个数的图片单元内的 非零像素点的个数识别所述图像中的字符,包括: 依据窗口滑动顺序统计所述第二个数的图片单元中的每一个图片单元所包含的第一 组非零像素点的个数; 依据窗口滑动顺序统计字符数据库中的每一个字符的模板对应的模板单元的分辨率 大小的第二组非零像素点的个数; 根据所述第一组非零像素点的个数和所述第二组非零像素点的个数识别所述图像中 的字符。5. 根据权利要求4所述的方法,其特征在于,所述根据所述第一组非零像素点的个数 和所述第二组非零像素点的个数识别所述图像中的字符,包括: 依据窗口滑动顺序统计所述第一组非零像素点的个数与所述第二组非零像素点的个 数的差值的绝对值; 确定所述第二个数的绝对值的和值中的最小值对应的字符模板; 将所述最小值对应的字符模板对应的字符识别为所述字符图片中的字符。6. -种识别图像中的字符的装置,其特征在于,所述装置包括: 第一确定模块,被配置为确定所述图像中所包含的字符的第一个数; 第一分割模块,被配置为将所述图像中所包含的字符分割为所述第一确定模块确定的 所述第一个数的字符图片; 第二分割模块,被配置为将所述第一分割模块分割得到的所述字符图片沿着设定大小 的窗口滑动从而将所述字符图片分割成第二个数的图片单元; 识别模块,被配置为根据所述第二分割模块分割得到的所述第二个数的图片单元内的 非零像素点的个数识别所述图像中的字符。7. 根据权利要求6所述的装置,其特征在于,所述装置还包括: 图像预处理模块,被配置为对所述图像进行边缘增强并二值化,得到二值化后的图像; 之后,所述第一确定模块执行所述确定所述图像中所包含的字符的第一个数的步骤。8. 根据权利要求7所述的装置,其特征在于,所述装置还包括: 第二确定模块,被配置为从所述图像预处理模块二值化后的所述图像的水平方向与竖 直方向确定所述第一个数的字符在所述图像中的梯度; 第三确定模块,被配置为通过所述第二确定模块确定的所述梯度确定所述字符在所述 水平方向与所述竖直方向的边界;之后,所述第一分割模块执行所述根据所述水平边界和 所述竖直边界将所述图像中所包含的字符分割为所述第一个数的字符图片的步骤。9. 根据权利要求6所述的装置,其特征在于,所述识别模块包括: 第一统计子模块,被配置为依据窗口滑动顺序统计所述第二分割模块分割后的所述第 二个数的图片单元中的每一个图片单元所包含的第一组非零像素点的个数; 第二统计子模块,被配置为依据窗口滑动顺序统计字符数据库中的每一个字符的模板 对应的模板单元的分辨率大小的第二组非零像素点的个数; 第一识别子模块,被配置为根据所述第一统计子模块统计得到的所述第一组非零像素 点的个数和所述第二统计子模块统计得到的所述第二组非零像素点的个数识别所述图像 中的字符。10. 根据权利要求9所述的装置,其特征在于,所述第一识别子模块包括: 计算子模块,被配置为依据窗口滑动顺序统计所述第一组非零像素点的个数与所述第 二组非零像素点的个数的差值的绝对值; 确定子模块,被配置为确定所述计算子模块计算得到的所述第二个数的绝对值的和值 中的最小值对应的字符模板; 第二识别子模块,被配置为将所述确定子模块确定的所述最小值对应的字符模板对应 的字符识别为所述字符图片中的字符。11. 一种识别图像中的字符的装置,其特征在于,所述装置包括: 处理器; 用于存储处理器可执行指令的存储器; 其中,所述处理器被配置为: 确定所述图像中所包含的字符的第一个数; 将所述图像中所包含的字符分割为所述第一个数的字符图片; 将所述字符图片沿着设定大小的窗口滑动从而将所述字符图片分割成第二个数的图 片单元; 根据所述第二个数的图片单元内的非零像素点的个数识别所述图像中的字符。
【专利摘要】本公开是关于一种确定图像中的字符的方法及装置,用以降低字符识别过程中的计算量。所述方法包括:确定所述图像中所包含的字符的第一个数;将所述图像中所包含的字符分割为所述第一个数的字符图片;将所述字符图片沿着设定大小的窗口滑动从而将所述字符图片分割成第二个数的图片单元;根据所述第二个数的图片单元内的非零像素点的个数识别所述图像中的字符。本公开技术方案简化字符识别过程中的复杂度,降低字符识别过程中的计算量,增强字符识别时的鲁棒性。
【IPC分类】G06K9/34
【公开号】CN104899588
【申请号】CN201510369334
【发明人】龙飞, 陈志军, 张涛
【申请人】小米科技有限责任公司
【公开日】2015年9月9日
【申请日】2015年6月26日

最新回复(0)