字符的识别方法及手写笔的制作方法
【技术领域】
[0001]本发明涉及字符识别技术领域,尤其涉及一种字符的识别方法及手写笔。
【背景技术】
[0002]在日常生活或工作中,在考场或会议现场等很多场合,用户一般依赖于手写笔在纸质文档上进行书写记录,但纸质文档存储有一定的期限,不利于长期存储,且在后续查询过程中存在很大的不便利。如果将所记录的信息录入计算机等智能终端中时,还需要将其以手动录入的方式逐个录入,录入效率低,录入工作量大。
[0003]上述内容仅用于辅助理解本发明的技术方案,并不代表承认上述内容是现有技术。
【发明内容】
[0004]本发明的主要目的在于提供一种字符的识别方法及手写笔,旨在解决现有的手写笔书写功能单一化,不利于记录内容的录入及存储的技术问题。
[0005]为实现上述目的,本发明提供一种字符的识别方法,所述字符的识别方法包括以下步骤:
[0006]获取手写笔在书写时的书写笔迹数据;
[0007]根据所述书写笔迹数据提取每个字符的数字特征信息;
[0008]获取预存的字符的标准特征信息,根据所述标准特征信息识别所提取的每个字符的数字特征信息对应的字符。
[0009]优选地,所述根据所述书写笔迹数据提取每个字符的数字特征信息的步骤包括:
[0010]将所述书写笔迹数据进行二值化处理,并对二值化处理后得到的图像数据进行离散化,得到矩阵数据;
[0011]将所述矩阵数据进行轨迹分割处理;
[0012]提取分割处理后的矩阵数据中每个字符的数字特征信息。
[0013]优选地,所述获取预存的字符的标准特征信息,根据所述标准特征信息识别所提取的每个字符的数字特征信息对应的字符的步骤包括:
[0014]获取预存的字符的标准特征信息,计算所述每个字符的数字特征信息与所述标准特征信息的相似度;
[0015]获取相似度达到预设阈值的标准特征信息对应的字符作为所述每个字符的数字特征信息对应的字符。
[0016]优选地,所述获取预存的字符的标准特征信息,根据所述标准特征信息识别所提取的每个字符的数字特征信息对应的字符的步骤之后包括:
[0017]存储识别得到的所述字符;
[0018]将所存储的字符发送给终端。
[0019]优选地,所述获取手写笔在书写时的书写笔迹数据的步骤之前包括:
[0020]获取所述手写笔受到的压力值;
[0021]当所述压力值达到预设阈值时,感应所述手写笔在三轴方向上运动时的加速度数据;
[0022]根据所述加速度数据生成所述手写笔迹数据。
[0023]此外,为实现上述目的,本发明还提供一种手写笔,所述手写笔包括字符识别模块,所述字符识别模块包括:
[0024]获取单元,用于获取手写笔在书写时的书写笔迹数据;
[0025]提取单元,用于根据所述书写笔迹数据提取每个字符的数字特征信息;
[0026]识别单元,用于获取预存的字符的标准特征信息,根据所述标准特征信息识别所提取的每个字符的数字特征信息对应的字符。
[0027]优选地,所述提取单元具体用于将所述书写笔迹数据进行二值化处理,并对二值化处理后得到的图像数据进行离散化,得到矩阵数据;将所述矩阵数据进行轨迹分割处理;提取分割处理后的矩阵数据中每个字符的数字特征信息。
[0028]优选地,所述识别单元具体用于获取预存的字符的标准特征信息,计算所述每个字符的数字特征信息与所述标准特征信息的相似度;获取相似度达到预设阈值的标准特征信息对应的字符作为所述每个字符的数字特征信息对应的字符。
[0029]优选地,所述手写笔还包括:
[0030]存储模块,用于存储识别得到的所述字符;
[0031]发送模块,用于将所存储的字符发送给终端。
[0032]优选地,所述手写笔还包括:
[0033]压力传感模块,用于获取所述手写笔受到的压力值;
[0034]处理模块,用于判断所述压力值是否达到预设阈值;
[0035]加速度传感模块,用于若是,感应所述手写笔在三轴方向上运动时的加速度数据;
[0036]生成模块,用于根据所述加速度数据生成所述手写笔迹数据。
[0037]本发明一种字符的识别方法及手写笔,在手写笔中内置相关的感应器件,感应得到手写笔在书写时的书写笔迹数据,通过书写过程中手写笔对书写笔迹数据提取每个字符的数字特征信息,并进行字符识别,能够实现将纸质文档电子化,有利于书写内容的长期保存,且方便于后续的查询;不需要将书写内容通过人工的方式录入计算机等智能终端中,大大减少录入工作量。
【附图说明】
[0038]图1为本发明字符的识别方法一实施例的流程示意图;
[0039]图2为图1中步骤S102的细化流程示意图;
[0040]图3为图1中步骤S103的细化流程示意图;
[0041]图4为本发明手写笔第一实施例的功能模块示意图;
[0042]图5为本发明手写笔第二实施例的功能模块示意图;
[0043]图6为本发明手写笔第三实施例的功能模块示意图。
[0044]本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
【具体实施方式】
[0045]应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
[0046]本发明提供一种字符的识别方法,参照图1,在一实施例中,该字符的识别方法包括:
[0047]步骤S101,获取手写笔在书写时的书写笔迹数据;
[0048]本实施例中,手写笔内置加速度传感器件,加速度传感器件例如可以是三轴陀螺仪,手写笔在书写时,加速度传感器件可以感应到其在三轴方向上的加速度,通过三轴方向上的加速度值,可以分析得到手写笔在书写时的笔尖的运动轨迹,记录该笔尖的运动轨迹,以该笔尖的运动轨迹作为本实施例的书写笔迹数据。
[0049]步骤S102,根据所述书写笔迹数据提取每个字符的数字特征信息;
[0050]本实施例中,书写笔迹数据不能较准确地反映用户在书写时的字符,因此,需要对书写笔迹数据进行相应的图像处理:对书写笔迹数据进行二值化处理,得到只有黑和白两种灰度的二值化图像,然后将二值化图像进行离散化,提取离散化处理后得到矩阵数据中每个字符的数字特征信息,通过这种方式,在获取到用户所书写的字符的数字特征信息后,可以对数字特征信息进行识别,较为准确地得到用户所书写的字符。
[0051]本实施例中,在对书写笔迹数据进行相应的图像处理的过程中,可以做相应的一些额外处理,例如可以先对书写笔迹数据进行去噪处理,去除明显存在的干扰因素,以提高所提取的字符的数字特征信息的准确性。
[0052]另外,本实施例不限定于上述对书写笔迹数据进行相应的图像处理的方式,其他图像处理方式能够提取书写笔迹数据中每个字符的数字特征信息的方式均在本实施例的保护范围内。
[0053]步骤S103,获取预存的字符的标准特征信息,根据所述标准特征信息识别所提取的每个字符的数字特征信息对应的字符。
[0054]本实施例中,获取预存的字符的标准特征信息,对比标准特征信息与所提取的每个字符的数字特征信息,并计算两者的相似度,取相似度最大的标准特征信息对应的字符作为本实施例最终识别得到的字符,即作为用户书写的字符,该最终识别得到的字符为电子档的字符。
[0055]本实施例中,所识别出来的字符可以是汉字或者其他的字符,如英文字符或者法文字符等。
[0056]本实施例中,在最终识别得到字符后,还可以进一步根据上下文关系,采用自然语言进行连接处理,以识别得到更准确地字符。
[0057]本实施例基于手写笔的字符的识别方法可以应用在很多场景
中:
[0058]1、记者现场记录新闻发言人解答重点,书写过程中通过本实施例使用手写笔进行记录,所记录的内容可以及时转换成电子文档,后面对电子文档稍作修改就可以发新闻稿,保证新闻的实时性,不需要根据文档进行录入;
[0059]2、学生在课堂上使用手写笔做笔记,可将笔记同步上传到手机等终端上,方便其随时查看笔记,不需要携带专门的笔记本,且在笔记查询及整理上具有明显的优势;
[0060]3、工作人员使用手写笔做会议纪要,会议纪要可以同步上传到电脑,省去工作人员在会后手动进行整理的操作;
[0061]4、外出时使用手写笔写游记,可以免去携带电脑等较大型电子设备的麻烦,而携带手机等小型电子设备输入效率较低。
[0062]与现有技术相比,本实施例在手写笔中内置相关的感应器件,感应得到手写笔在书写时的书写笔迹数据,通过书写过程中手写笔对书写笔迹数据提取每个字符的数字特征信息,并进行字符识别,能够实现将纸质文档电子化,有利于书写内容的长期保存,且方便于后续的查询;不需要将书写内容通过人工的方式录入计算机等智能终端中,大大减少录入工作量。
[0063]在一优选的实施例中,如图2所示,在上述图1的实施例的基础上,上述步骤S102包括:
[0064]步骤S1021,将所述书写笔迹数据进行二值化处理,并对二值化处理后得到的图像数据进行离散化,得到矩阵数据;
[0065]步骤S1022,将所述矩阵数据进行轨迹分割处理;
[0066]步骤S1023,提取分割处理后的矩阵数据中每个字符的数字特征信息。
[0067]本实施例中,在获取到手写笔在书写时的书写笔迹数据后,可以先对书写笔迹数据进行降噪处理,以去除明显存在的干扰因素。然后采用二值化处理,将书写笔迹数据转换成只有黑(I)和白(O)两种灰度的二值化图像,离散化二值化图像后就变成了 O及I的矩阵数据。
[0068]本实施例可以采用插值法对离散化后的矩阵数据进行归一化处理,然后将归一化处理后的矩阵数据进行轨迹分割,以分割为单个的字符对应的矩阵数,采用Gaussian-Hermite方程进行矩阵数据的特征提取,从而提取到每个字符的数字特征信息。
[0069]在一优选的实施例中,如图3所示,在上述图1的实施例的基础上,上述步骤S103包括:
[0070]步骤S1031,获取预存的字符的标准特征信息,计算所述每个字符的数字特征信息与所述标准特征信息的相似度;
[0071]步骤S1032,获取相似度达到预设阈值的标准特征信息对应的字符作为所述每个字符的数字特征信息对应的字符。
[0072]本实施例中,获取预存的字符的标准特征信息,通过模板匹配法将单个字符的数字特征信息与预存的字符的标准特征信息进行对比,并计算每个字符的数字特征信息与预存的字符的标准特征信息的相似度,取相似度达到预设阈值的标准特征信息对应的字符为每个字符的数字特征信息对应的字符,也就是识别出所书写的字符。
[0073]本实施例中,在最终识别得到字符后,还可以进一步根据上下文关系,采用自然语言进行连接处理,以识别得到更准确地字符。
[0074]在一优选的实施例中,在上述图1的实施例的基础上,在上述步骤S103之后还包括:存储识别得到的所述字符;将所存储的字符发送给终端。
[0075]本实施例中,手写笔中内置存储器,可以将识别出来的字符存储到存储器中,有利于所记录的内容的长期保存。
[0076]另外,手写笔中还可以内置无线通信装置,例如内置蓝牙模块或者近场通讯模块,当手写笔开启通信功能后,可以将所存储的内容发送其他终端,其他终端可以进行显示或者长期存储。
[0077]在一优选的实施例中,在上述图1的实施例的基础上,在上述步骤SlOl之前还包括:获取所述手写笔受到的压力值;判断所述压力值是否达到预设阈值;当所述压力值达到预设阈值时,感应所述手写笔在三轴方向上运动时的加速度数据;根据所述加速度数据生成所述手写笔迹数据。
[0078]本实施例中,可在手写笔内置压力传感器、处理器及加速度传感器,加速度传感器优选为三轴陀螺仪,可采集到手写笔在三轴方向上的加速度数据。通过压力传感器获取手写笔受到的压力值,将压力值发送给处理器,处理器判断该压力值是否达到预设阈值,如果未达到预设阈值,则判断手写笔当前不是处于书写状态,如果达到预设阈值,则判断手写笔当前处于书写状态。在写笔当前处于书写状态时,处理器将该状态对应的信号发送给加速度传感器,以启动加速度传感器来采集相关的加速度数据,然后根据加速度数据生成手写笔迹数据。
[0079]本发明还提供一种手写笔,如图4所示,在一实施例中,手写笔包括字符识别模块10,所述字符识别模块10包括:
[0080]获取单元101,用于获取手写笔在书写时的书写笔迹数据;
[0081]本实施例中,手写笔内置加速度传感器件,加速度传感器件例如可以是三轴陀螺仪,手写笔在书写时,加速度传感器件可以感应到其在三轴方向上的加速度,通过三轴方向上的加速度值,可以分析得到手写笔在书写时的笔尖的运动轨迹,记录该笔尖的运动轨迹,以该笔尖的运动轨迹作为本实施例的书写笔迹数据。
[0082]提取单元102,用于根据所述书写笔迹数据提取每个字符的数字特征信息;
[0083]本实施例中,书写笔迹数据不能较准确地反映用户在书写时的字符,因此,需要对书写笔迹数据进行相应的图像处理:对书写笔迹数据进行二值化处理,得到只有黑和白两种灰度的二值化图像,然后将二值化图像进行离散化,提取离散化处理后得到矩阵数据中每个字符的数字特征信息,通过这种方式,在获取到用户所书写的字符的数字特征信息后,可以对数字特征信息进行识别,较为准确地得到用户所书写的字符。
[0084]本实施例中,在对书写笔迹数据进行相应的图像处理的过程中,可以做相应的一些额外处理,例如可以先对书写笔迹数据进行去噪处理,去除明显存在的干扰因素,以提高所提取的字符的数字特征信息的准确性。
[0085]另外,本实施例不限定于上述对书写笔迹数据进行相应的图像处理的方式,其他图像处理方式能够提取书写笔迹数据中每个字符的数字特征信息的方式均在本实施例的保护范围内。
[0086]识别单元103,用于获取预存的字符的标准特征信息,根据所述标准特征信息识别所提取的每个字符的数字特征信息对应的字符。
[0087]本实施例中,获取预存的字符的标准特征信息,对比标准特征信息与所提取的每个字符的数字特征信息,并计算两者的相似度,取相似度最大的标准特征信息对应的字符作为本实施例最终识别得到的字符,即作为用户书写的字符,该最终识别得到的字符为电子档的字符。
[0088]本实施例中,所识别出来的字符可以是汉字或者其他的字符,如英文字符或者法文字符等。
[0089]本实施例中,在最终识别得到字符后,还可以进一步根据上下文关系,采用自然语言进行连接处理,以识别得到更准确地字符。
[0090]本实施例基于手写笔的字符的识别方法可以应用在很多场景中:
[0091]1、记者现场记录新闻发言人解答重点,书写过程中通过本实施例使用手写笔进行记录,所记录的内容可以及时转换成电子文档,后面对电子文档稍作修改就可以发新闻稿,保证新闻的实时性,不需要根据文档进行录入;
[0092]2、学生在课堂上使用手写笔做笔记,可将笔记同步上传到手机等终端上,方便其随时查看笔记,不需要携带专门的笔记本,且在笔记查询及整理上具有明显的优势;
[0093]3、工作人员使用手写笔做会议纪要,会议纪要可以同步上传到电脑,省去工作人员在会后手动进行整理的操作;
[0094]4、外出时使用手写笔写游记,可以免去携带电脑等较大型电子设备的麻烦,而携带手机等小型电子设备输入效率较低。
[0095]与现有技术相比,本实施例在手写笔中内置相关的感应器件,感应得到手写笔在书写时的书写笔
迹数据,通过书写过程中手写笔对书写笔迹数据提取每个字符的数字特征信息,并进行字符识别,能够实现将纸质文档电子化,有利于书写内容的长期保存,且方便于后续的查询;不需要将书写内容通过人工的方式录入计算机等智能终端中,大大减少录入工作量。
[0096]在一优选的实施例中,在上述图4的实施例的基础上,提取单元102具体用于将所述书写笔迹数据进行二值化处理,并对二值化处理后得到的图像数据进行离散化,得到矩阵数据;将所述矩阵数据进行轨迹分割处理;提取分割处理后的矩阵数据中每个字符的数字特征信息。
[0097]本实施例中,在获取到手写笔在书写时的书写笔迹数据后,可以先对书写笔迹数据进行降噪处理,以去除明显存在的干扰因素。然后采用二值化处理,将书写笔迹数据转换成只有黑(I)和白(O)两种灰度的二值化图像,离散化二值化图像后就变成了 O及I的矩阵数据。
[0098]本实施例可以采用插值法对离散化后的矩阵数据进行归一化处理,然后将归一化处理后的矩阵数据进行轨迹分割,以分割为单个的字符对应的矩阵数,采用Gaussian-Hermite方程进行矩阵数据的特征提取,从而提取到每个字符的数字特征信息。
[0099]在一优选的实施例中,在上述图4的实施例的基础上,识别单元103具体用于获取预存的字符的标准特征信息,计算所述每个字符的数字特征信息与所述标准特征信息的相似度;获取相似度达到预设阈值的标准特征信息对应的字符作为所述每个字符的数字特征信息对应的字符。
[0100]本实施例中,获取预存的字符的标准特征信息,通过模板匹配法将单个字符的数字特征信息与预存的字符的标准特征信息进行对比,并计算每个字符的数字特征信息与预存的字符的标准特征信息的相似度,取相似度达到预设阈值的标准特征信息对应的字符为每个字符的数字特征信息对应的字符,也就是识别出所书写的字符。
[0101]本实施例中,在最终识别得到字符后,还可以进一步根据上下文关系,采用自然语言进行连接处理,以识别得到更准确地字符。
[0102]在一优选的实施例中,如图5所示,在上述图4的实施例的基础上,所述手写笔还包括:
[0103]存储模块20,用于存储识别得到的所述字符;
[0104]发送模块30,用于将所存储的字符发送给终端。
[0105]本实施例中,手写笔中内置存储模块20,可以将识别出来的字符存储到存储器中,有利于所记录的内容的长期保存。
[0106]另外,手写笔中还可以内置无线通信装置,例如内置蓝牙模块或者近场通讯模块,当手写笔开启通信功能后,发送模块30可以将所存储的内容发送其他终端,其他终端可以进行显示或者长期存储。
[0107]在一优选的实施例中,如图6所示,在上述图4的实施例的基础上,所述手写笔还包括:
[0108]压力传感模块01,用于获取所述手写笔受到的压力值;
[0109]处理模块02,用于判断所述压力值是否达到预设阈值;
[0110]加速度传感模块03,用于若是,感应所述手写笔在三轴方向上运动时的加速度数据;
[0111]生成模块04,用于根据所述加速度数据生成所述手写笔迹数据。
[0112]本实施例中,加速度传感模块03优选为三轴陀螺仪,可采集到手写笔在三轴方向上的加速度数据。通过压力传感模块01获取手写笔受到的压力值,将压力值发送给处理模块02,处理模块02判断该压力值是否达到预设阈值,如果未达到预设阈值,则判断手写笔当前不是处于书写状态,如果达到预设阈值,则判断手写笔当前处于书写状态。在写笔当前处于书写状态时,处理模块02将该状态对应的信号发送给加速度传感模块03,以启动加速度传感模块03来采集相关的加速度数据,然后根据加速度数据生成手写笔迹数据。
[0113]以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。
【主权项】
1.一种字符的识别方法,其特征在于,所述字符的识别方法包括以下步骤: 获取手写笔在书写时的书写笔迹数据; 根据所述书写笔迹数据提取每个字符的数字特征信息; 获取预存的字符的标准特征信息,根据所述标准特征信息识别所提取的每个字符的数字特征信息对应的字符。2.如权利要求1所述的字符的识别方法,其特征在于,所述根据所述书写笔迹数据提取每个字符的数字特征信息的步骤包括: 将所述书写笔迹数据进行二值化处理,并对二值化处理后得到的图像数据进行离散化,得到矩阵数据; 将所述矩阵数据进行轨迹分割处理; 提取分割处理后的矩阵数据中每个字符的数字特征信息。3.如权利要求2所述的字符的识别方法,其特征在于,所述获取预存的字符的标准特征信息,根据所述标准特征信息识别所提取的每个字符的数字特征信息对应的字符的步骤包括: 获取预存的字符的标准特征信息,计算所述每个字符的数字特征信息与所述标准特征信息的相似度; 获取相似度达到预设阈值的标准特征信息对应的字符作为所述每个字符的数字特征信息对应的字符。4.如权利要求1所述的字符的识别方法,其特征在于,所述获取预存的字符的标准特征信息,根据所述标准特征信息识别所提取的每个字符的数字特征信息对应的字符的步骤之后包括: 存储识别得到的所述字符; 将所存储的字符发送给终端。5.如权利要求1或4所述的字符的识别方法,其特征在于,所述获取手写笔在书写时的书写笔迹数据的步骤之前包括: 获取所述手写笔受到的压力值; 当所述压力值达到预设阈值时,感应所述手写笔在三轴方向上运动时的加速度数据; 根据所述加速度数据生成所述手写笔迹数据。6.一种手写笔,其特征在于,所述手写笔包括字符识别模块,所述字符识别模块包括: 获取单元,用于获取手写笔在书写时的书写笔迹数据; 提取单元,用于根据所述书写笔迹数据提取每个字符的数字特征信息; 识别单元,用于获取预存的字符的标准特征信息,根据所述标准特征信息识别所提取的每个字符的数字特征信息对应的字符。7.如权利要求6所述的手写笔,其特征在于,所述提取单元具体用于将所述书写笔迹数据进行二值化处理,并对二值化处理后得到的图像数据进行离散化,得到矩阵数据;将所述矩阵数据进行轨迹分割处理;提取分割处理后的矩阵数据中每个字符的数字特征信息。8.如权利要求7所述的手写笔,其特征在于,所述识别单元具体用于获取预存的字符的标准特征信息,计算所述每个字符的数字特征信息与所述标准特征信息的相似度;获取相似度达到预设阈值的标准特征信息对应的字符作为所述每个字符的数字特征信息对应的字符。9.如权利要求6所述的手写笔,其特征在于,所述手写笔还包括: 存储模块,用于存储识别得到的所述字符; 发送模块,用于将所存储的字符发送给终端。10.如权利要求6或9所述的手写笔,其特征在于,所述手写笔还包括: 压力传感模块,用于获取所述手写笔受到的压力值; 处理模块,用于判断所述压力值是否达到预设阈值; 加速度传感模块,用于若是,感应所述手写笔在三轴方向上运动时的加速度数据; 生成模块,用于根据所述加速度数据生成所述手写笔迹数据。
【专利摘要】本发明公开了一种字符的识别方法及手写笔,所述字符的识别方法包括以下步骤:获取手写笔在书写时的书写笔迹数据;根据所述书写笔迹数据提取每个字符的数字特征信息;获取预存的字符的标准特征信息,根据所述标准特征信息识别所提取的每个字符的数字特征信息对应的字符。本发明能够实现将纸质文档电子化,有利于书写内容的长期保存,且方便于后续的查询;不需要将书写内容通过人工的方式录入计算机等智能终端中,大大减少录入工作量。
【IPC分类】G06K9/00
【公开号】CN104899560
【申请号】CN201510279740
【发明人】李成
【申请人】努比亚技术有限公司
【公开日】2015年9月9日
【申请日】2015年5月27日