基于摄像头的汉字识别方法

xiaoxiao2021-2-25  401

基于摄像头的汉字识别方法
【技术领域】
[0001]本发明涉及文字识别技术,特别涉及基于摄像头的汉字识别方法。
【背景技术】
[0002]目前通过手机摄像头识别汉字的方法大致有两种,一种是通过摄像头框取,然后扫描并识别汉字的方法;一种是通过先拍得一张包含所需汉字的图片,然后通过涂抹所要识别汉字,再将涂抹区域进行识别的方法。第一种需要用户不断调整摄像头的上下距离和左右位置来框取,并点击确认来获取所要识别的汉字,其操作不好控制;第二种需要先获取照片并涂抹,其步骤过多且涂抹位置不好把握。

【发明内容】

[0003]本发明的目的是为了解决现有的汉字识别方法操作繁琐不易控制的问题。
[0004]为达到上述目的,本发明提供一种基于摄像头的汉字识别方法,其特征在于,包括如下步骤:
[0005]A.通过摄像头获取包含所需要识别汉字的完整画面;
[0006]B.用户在屏幕上点击所需识别的汉字画面,系统获取所述画面的当前一帧,同时记录用户点击的位置的坐标(x,y);
[0007]C.通过图片文字识别技术得到所获取的帧上汉字相对于屏幕分辨率下的字体大小d;
[0008]D.计算得到汉字的识别矩阵范围,同时在所述画面上标注所述识别矩阵范围,所述识别矩阵范围左上角坐标为(x-d,y-d),右下角坐标为(x+d,y+d);
[0009]E.在获取到的帧上截取所述识别矩阵范围内的图片,通过图片文字识别技术识别所截取图片内的汉字,利用互联网文字库获取汉字的基本信息,连同所识别出的汉字一同在屏幕上进行显示。
[0010]具体地,通过图片文字识别技术识别所截取图片内的汉字时,根据概率在屏幕上依次罗列识别到的汉字。
[0011]具体地,若所罗列的汉字都不是摄像头所获取的汉字,则重新进入步骤A。
[0012]本发明中,进行操作的设备可以是任何带有摄像头的智能终端设备,例如智能手机、智能平板电脑等。本发明中的图片文字识别技术为现有技术,例如百度、谷歌等的图片文字识别技术。
[0013]本发明的有益效果是:本发明提供的基于摄像头的汉字识别方法,用户通过带有摄像头的智能终端设备,在获取汉字的图像后,即可以智能地获取汉字对应的基本信息,并通过智能终端的显示屏幕进行显示。
【具体实施方式】
[0014]以下通过具体实例对本发明的技术方案作进一步详细描述。
[0015]本发明为解决现有的汉字识别方法操作繁琐不易控制的问题,提供一种基于摄像头的汉字识别方法,该方法包括如下步骤:
[0016]A.通过摄像头获取包含所需要识别汉字的完整画面;
[0017]B.用户在屏幕上点击所需识别的汉字画面,系统获取所述画面的当前一帧,同时记录用户点击的位置的坐标(x,y);
[0018]C.通过图片文字识别技术得到所获取的帧上汉字相对于屏幕分辨率下的字体大小d;
[0019]D.计算得到汉字的识别矩阵范围,同时在所述画面上标注所述识别矩阵范围,所述识别矩阵范围左上角坐标为(x-d,y-d),右下角坐标为(x+d,y+d);
[0020]E.在获取到的帧上截取所述识别矩阵范围内的图片,通过图片文字识别技术识别所截取图片内的汉字,利用互联网文字库获取汉字的基本信息,连同所识别出的汉字一同在屏幕上进行显示。
[0021]以下对用户通过智能终端采用本发明的方法获取汉字及其基本信息的过程进行一示例性说明。
[0022]首先,用户打开摄像头,获取包含所需识别汉字的画面,在操作时,应当注意尽量使摄像头包含整个汉字。然后,在智能终端的屏幕上点击所需识别的汉字,同时获取当前帧与点击位置。之后,通过图片识别技术获取帧上汉字大小,根据汉字大小计算识别范围。在确定识别范围后,截取帧上范围内画面,通过图片识别技术得到范围内的汉字。本发明的方法,识别出汉字之后在屏幕右边罗列识别到的汉字,同时在屏幕上方推荐最可能的汉字给用户,显示其基本信息。用户可以点击一旁的“更多”按钮获取推荐汉字的详细信息。若推荐汉字不符合,则用户可点击屏幕右边所罗列的汉字,点击所需汉字,将显示其详细信息。若无一字符合,则可点击右下角的“重新点击”按钮重新点击要识别的汉字。
[0023]本发明中,由于需要使用汉字库获取汉字及其基本的信息,因此,一般情况下,本发明的智能终端必须具备网络连接功能,只有在智能终端与汉字库连接之后,才能获取汉字及其基本信息,否则,智能终端必须具备庞大的数据存储功能用以存储汉字库。
【主权项】
1.基于摄像头的汉字识别方法,其特征在于,包括如下步骤: A.通过摄像头获取包含所需要识别汉字的完整画面; B.用户在屏幕上点击所需识别的汉字画面,系统获取所述画面的当前一帧,同时记录用户点击的位置的坐标(x,y); C.通过图片文字识别技术得到所获取的帧上汉字相对于屏幕分辨率下的字体大小d; D.计算得到汉字的识别矩阵范围,同时在所述画面上标注所述识别矩阵范围,所述识别矩阵范围左上角坐标为(x-d,y-d),右下角坐标为(x+d,y+d); E.在获取到的帧上截取所述识别矩阵范围内的图片,通过图片文字识别技术识别所截取图片内的汉字,利用互联网文字库获取汉字的基本信息,连同所识别出的汉字一同在屏幕上进行显示。2.如权利要求1所述的基于摄像头的汉字识别方法,其特征在于,步骤E中,通过图片文字识别技术识别所截取图片内的汉字时,根据概率在屏幕上依次罗列识别到的汉字。3.如权利要求1所述的基于摄像头的汉字识别方法,其特征在于,步骤E中,若所罗列的汉字都不是摄像头所获取的汉字,则重新进入步骤A。
【专利摘要】本发明涉及文字识别技术,目的是为了解决现有的汉字识别方法操作繁琐不易控制的问题。本发明提供的基于摄像头的汉字识别方法的步骤如下:打开摄像头,获取包含所需识别汉字的画面。点击所需识别的汉字,同时获取当前帧与点击位置。获取帧上汉字大小,根据汉字大小计算识别范围。截取帧上范围内画面,通过图片识别技术得到范围内的汉字。在屏幕右边罗列识别到的汉字,同时在屏幕上方推荐最可能的汉字给用户,显示其基本信息。用户点击一旁的“更多”按钮获取推荐汉字的详细信息。若推荐汉字不符合,则用户可点击屏幕右边所罗列的汉字,点击所需汉字,将显示其详细信息。本发明适用于汉字识别。
【IPC分类】G06K9/32
【公开号】CN105488504
【申请号】CN201511005440
【发明人】汪靖博
【申请人】四川长虹网络科技有限责任公司
【公开日】2016年4月13日
【申请日】2015年12月28日

最新回复(0)