商业文档处理器的制作方法

xiaoxiao2020-7-22  5

专利名称:商业文档处理器的制作方法
技术领域
本发明涉及商业文档处理器以及例如用于去除商业文档内的印痕(seal impression)的技术。
背景技术
对于在公司内存档的庞大数量的纸质商业文档,近年来在实现检索性能、纸质文档的安全存储和通过经由扫描和OCR的字符识别来共享知识的改进方面以及通过文档管理系统管理文档数据方面存在兴趣。虽然当前状态下的OCR对于没有干扰的文档具有高的字符串识别准确性,但是, 例如当如公司印章的印章图像等印章图像与字符串重叠时,存在该部分可能被错误识别的问题。如果该部分被错误识别,则不仅可能不能获得该部分的字符信息,而且还可能作为干扰出现并保留没有意义的字符信息,并且妨碍随后的检索。在商业文档中出现的印章图像具有以下特性通常以印章图像与例如客户名称、客户的代表的名称等客户的信息重叠的方式附加印章图像。这样条目的信息在识别文档时通常是至关重要的。从而,如果不能识别这样的信息,则在检索过程中将不返回这些文档,并且将必须检查所有所注册的文档数据。 为此,当应用OCR时还需高度准确地识别与印痕重叠的字符串。为了改善这样的OCR的识别准确性,提出了用于将与字符串重叠的印痕分离的方法。例如,在专利文献1和专利文献2中,提出了用于通过使用印痕的颜色和文档中的文本的颜色之间的区别从文本中辨别印痕来识别并去除印痕的技术。从而,即使文本和印痕互相重叠,也可以仅去除印痕而保留重叠的文本。另外,在专利文献3中,提出了用于利用印痕的轮廓通常呈现规则的多边形的形式的事实来识别并去除印痕的技术。从而,在文本和印痕互相重叠的情况下,可以通过去除印痕和与该印痕重叠的字符串来防止OCR的错误识别。引用列表专利文献1 日本专利公开(Kokai)No. 2008-176521A专利文献2 日本专利公开(Kokai)No. 2006-309781A专利文献3 日本专利公开(Kokai) No. 9-229646A (1997)

发明内容
技术问题然而,由于有时以灰度来保存已经电子存档的商业文档,因此专利文献1和2中的技术(其是通过颜色识别印痕的技术)是不可用的。图2是示出以灰度扫描的商业文档的示例,其中公司印章以与一部分公司信息重叠的方式被附加在右上部。由于以灰度扫描这种文本,因此即使应用使用颜色信息识别印痕的专利文献1和2中的技术,也不可能识别附加了印痕的部分。另外,图3是示出其中通过专利文献3中的技术去除图2中的商业文档中的印痕并通过OCR识别剩余字符的结果。当通过专利文献3中的技术去除印痕时,如图3所示,重叠的字符串也与印痕一起被去除。因此,所去除的字符串信息丢失。另外,由于文本是部分剩余的,因此存在剩余的文本成为随后检索过程中的干扰的可能性。考虑到上述这些情况做出本发明,本发明提供一种用于在对以灰度保存的商业文档应用OCR时即使在字符串和印痕互相重叠的情况下也在保留字符串信息的同时仅去除印痕的技术。技术方案为了解决上述问题,根据本发明的商业文档处理器包括印痕检测处理部,用于检测以灰度输入的商业文档中的印痕区域,并从商业文档中去除印痕区域;印痕相关信息提取处理部,用于提取在已经去除了印痕区域的所述商业文档中的被去除的印痕区域附近存在的字符信息作为印痕相关信息(例如,与客户相关的信息),其中由于所述印痕区域导致部分字符是不清楚的;属性分类处理部,用于识别所提取的印痕相关信息的属性;及字符推断(extrapolation)处理部,用于参考保存了字符串候选的字符串候选数据库(例如,保存客户信息的客户数据库),并基于通过属性分类的印痕相关信息来推断与印痕区域重叠并且由此不清楚的字符串。另外,字符推断处理部用通过推断获得的字符串替代由于印痕区域导致不清楚的部分,并在文档数据库中与以灰度输入的商业文档成对地注册替代有字符串的商业文档数据。商业文档处理器可以进一步包括显示处理部,显示处理部用于在显示部上显示替代有字符串的商业文档数据。在这种情况下,如果存在被替代的多个字符串候选,则显示处理部在显示部上显示替代有多个字符串候选的多个商业文档数据,并且字符推断处理部在文档数据库中注册多个商业文档数据中的、由用户选择的商业文档数据。另外,字符推断处理部可以计算在字符串候选数据库中保存的信息和通过属性分类的印痕相关信息之间的匹配度,并且当所述匹配度超出预定值时使字符串候选数据库中保存的信息成为用于替代的字符串候选。另一方面,如果所述匹配度等于或小于预定值,则字符推断处理部在不用任何字符替代印痕区域的情况下终止处理。通过下面提供的实现本发明的最佳实施方式和附图,使得本发明的进一步的特征变得清楚。本发明的有益效果根据本发明,即使在文档中找到的字符串与例如公司印章的印痕等印痕重叠,也可以识别以灰度输入的文档。从而改善了商业文档的搜索性能,并进一步提高了文档管理系统的效率。


图1是示意性地示出根据本发明实施例的商业文档处理器的配置的功能框图。图2是示出在图1中的数据存储器中保存的灰度图像数据的示例的示意图。图3是示出在图1中的数据存储器中保存的OCR结果数据的示例的示意图。图4A是说明与在图1所示的数据存储器中保存的印痕相关数据的处理的示意图 ⑴。
图4B是说明与在图1所示的数据存储器中保存的印痕相关数据的处理的示意图 ⑵。图4C是说明与在图1所示的数据存储器中保存的印痕相关数据的处理的示意图 ⑶。图4D是说明与在图1所示的数据存储器中保存的印痕相关数据的处理的示意图 ⑷。图4E是说明与在图1所示的数据存储器中保存的印痕相关数据的处理的示意图 ⑶。图5A是示出在图1所示的文档数据库中包括的文档数据的示例的示意图。图5B是示出在图1所示的文档数据库中包括的文档数据的示例的示意图。图6是示出在图1中所示的客户数据库中包括的客户数据的示例的示意图。图7是示出在图1中所示的属性数据库中包括的属性数据的示例的示意图。图8是说明关于根据本发明实施例的商业文档处理器的处理的流程图。图9是具体说明由商业文档处理程序的字符替代处理部执行的处理(步骤S805) 细节的流程图。图10是示出显示了由于印痕而丢失的字符串已经被替代的结果的确认屏幕的示例的示意图。
具体实施例方式下面,参考附图具体描述用于实现本发明的商业文档处理器的最佳模式。图1到 10是示出本发明的示例性实施例的示意图。在这些示意图中,假设具有相同附图标记的部件代表相同的部件,并且它们的基本配置和操作是相同的。注意,在本发明的实施例中使用的装置、方法等仅是示例,而本发明并不局限于此。<商业文档处理器的配置>图1是示意性地示出根据本发明实施例的商业文档处理器的配置的功能框图。这个商业文档处理器包括保存与客户的交易等相关的商业文档以及对其构造的索引的文档数据库51 ;保存包括客户的公司名称、地址、主要电话号码等客户信息以及对其构造的索引的客户数据库52 ;保存字符串属性的定义数据的属性数据库53 ;用于输入/输出数据的输入/输出装置30 ;执行所需要的计算处理、控制处理等的中央处理单元10 ;保存对于中央处理单元10中的处理必需的程序的程序存储器40 ;及保存对于中央处理单元10中的处理必需的数据的数据存储器20。输入/输出装置30包括包含用于显示数据的显示装置32、打印机(未示出)等的输出部;及包含用于执行如关于所显示的数据的菜单选择等操作的键盘31、例如鼠标等定点设备33、用于扫描文档的扫描仪34等的输入部。程序存储器40包括检测文档中存在的、例如公司印章等的印痕的印痕检测处理部41 ;识别文档内的字符的OCR处理部42 ;将存在于印痕周围的字符串块切去的印痕相关信息区域提取处理部43 ;将字符串块内的字符串的属性进行分类的属性分类处理部44 ;及字符替代处理部45。注意,各个处理部作为程序代码被保存在程序存储器40中,并通过中央处理单元10执行各个程序代码来实现各个处理部。
数据存储器20包括通过以灰度扫描纸质文档获得的灰度图像数据21 ;通过对灰度图像数据21应用OCR产生的OCR结果数据22 ;及其中保存了关于OCR结果数据22内的印痕区域附近的字符串块的信息的印痕相关数据23。图2是示出在数据存储器20中包括的灰度图像数据21的示例的示意图。存在以与公司名称的一部分重叠的方式附加于右上部的公司印章。在该原件中,印痕是红色的,并且文本颜色是黑色的。从而,印痕和文本的颜色是不同的。然而,由于以灰度扫描该文档, 因此,文本和印痕具有相同的颜色。关于这样的数据,通过应用专利文献1和2中的利用颜色识别并分离印痕的技术不能将印痕和文本分离。另外,如果应用专利文献3中的技术,则由于不能将印痕和文本互相辨别,因此对图2中的图像数据应用该技术将导致如图3中所示的、印痕和与印痕重叠的字符串都被去除。图3是示出在数据存储器20中包括的OCR结果数据22的示例的示意图。通过印痕去除技术去除附加了印痕的、包括字符串的区域内部。另外,通过应用OCR,去除文本的粗体设置、下划线等,并统一字体。通常这是由于OCR不能识别下划线、粗体设置等。图4A到4E是示出与在数据存储器20中包括的印痕相关数据23的示例的示意图。它们示出一些数据,这些数据是某个区域的剪切(cutout),该区域附近的被去除的印痕区域原来存在于OCR结果数据22中。图4A是清楚地示出印痕相关区域和印痕区域的示意图。图4B是从OCR结果数据22中只剪切印痕相关区域的示意图。图4C是示出其中对在印痕相关数据23中包括的各个字符串分配的属性相对应的状态的示意图。图4D和4E是示出其中对于在印痕相关数据23中包括的字符串通过分析字符间隔估计由于印痕造成的字符丢失的数量的示例的示意图。由于通过OCR处理可识别字符串的字体大小,因此从具有未知字符的空间的大小可以确定应该存在的字符的数量。图5A和5B是示出在文档数据库51中包括的文档数据的示例的示意图。文档数据包括例如图5A所示的被扫描的商业文档以及例如图5B所示的索引数据(该数据是在受到印痕识别处理之后注册的数据,其中适当的字符被替代为印痕部分)。对文档数据分配唯一可识别的文档ID。另外,由于可获得完整文本信息,因此能够进行完整的文本搜索。图6是示出与客户相关并在客户数据库52中包括的数据的示例。如用于唯一识别客户的客户号、客户名称、地址等信息被保存。图7是示出在属性数据库53中包括的属性定义数据的示例的示意图。在图7中, 提供了用于将字符串分类为邮政编码、辖区名称、区域/城市/城镇/村庄名称等的定义。 在图7的示例中,以一行上的“字符图案属性”的格式来表达这些定义。例如,“TXXX-XXXX “邮政编码””表示如果在字符串内出现“Txxx-xxxx”(这里,χ是从0到9的任意数字),则该字符串的属性是邮政编码。<商业文档处理器中的处理>下面,描述在具有上述配置的商业文档处理器中执行的处理。图8是示意性地示出由商业文档处理器处理的流程的流程图。在图8中,首先,中央处理单元10使用印痕检测处理部41检测并去除由扫描仪34 输入的商业文档中的印痕(步骤S801)。随后,OCR处理部42对该商业文档应用OCR并识别该文档内的字符信息(步骤S802)。另外,印痕相关信息区域提取处理部43将印痕原来存在于OCR结果数据22中的区域附近的区域切去并提取印痕相关数据23 (步骤S803)。随
6后,属性分类处理部44确定在印痕相关数据23中存在的字符串的属性(步骤S804)。最后,字符替代处理部45将在客户数据库52中保存的各个客户数据与印痕相关数据23相匹配,并推断相关客户(步骤S805)。下面具体描述在各个步骤中的处理。<印痕检测处理>下面描述图8中的用于检测在商业文档中包括的印痕的处理(步骤S801)的细节。首先,印痕检测处理部41读取通过以灰度扫描商业文档获得的灰度图像数据21, 并搜索灰度图像数据21内的印痕的区域。这样做时,可使用如专利文献3中的技术等传统技术搜索印痕。另外,在印痕搜索之后,印痕检测处理部41去除包括印痕的轮廓的多边形区域。这里,由于通过专利文献3中的技术不能分离地识别印痕和字符串,因此当去除印痕区域时,也将字符串一起去除。随后,如下面描述的,通过字符替代处理部45从周围字符串进行推断来替代如上去除的字符串。<印痕相关信息区域提取处理>下面描述图8中的用于提取在商业文档中包括的并且包括客户信息的区域的处理(步骤S803)的细节。在该处理中,从如图3所示的OCR结果数据中切去例如图4B所示的印痕区域和与客户相关并存在于印痕区域附近的字符串块。首先,印痕相关信息区域提取处理部43将印痕区域(通过印痕检测处理检测到印痕的区域)设置为印痕相关信息区域的初始值,并扩大印痕相关信息区域以包括附近出现的字符串。具体地,印痕相关信息区域提取处理部43搜索印痕相关信息区域周围的字符串。例如,由于可以通过OCR处理识别在印痕周围出现的字符串的字体大小,因此以比这样的字体大小较窄的宽度(距离)连接的每个字符串可以被视为一个字符串。然后,印痕相关信息区域提取处理部43扩大印痕相关信息区域,扩大后的印痕相关信息区域是包括作为印痕相关信息区域的一部分的这样的字符串的矩形区域,并在数据存储器中将扩大后的印痕相关信息区域保存为印痕相关数据23。<属性分类处理>下面描述图8中的用于分配在印痕相关数据23中包括的字符串的属性的处理 (步骤S804)的细节。首先,属性分类处理部44读取印痕相关数据23,逐行地划分印痕相关数据23内的字符串,并分配每一行上的字符串的属性。具体地,属性分类处理部44使用属性数据库53 执行每一行上的字符串的形态学分析,并确定与适合各个字符串的属性。在本实施例中,通过以“(字符图案)(属性)”的格式编写属性数据库53的示例提供描述。例如,如果在属性数据库53中写入“Txxx-xxxx “邮政编码””(这里,χ是从0 到9的任意数字)并且感兴趣的字符串是“Τ100-0000”,则将确定该字符串与邮政编码的格式匹配,并将对该字符串分配邮政编码的属性。另外,如果在属性数据库53中写入“电话 “电话号码””并且感兴趣的字符串包括如在“电话(03) 1234-5678”中的字符串“电话”(或 “Tel”),则将电话号码的属性分配给该字符串。此外,存在以““辖区名称” + “区域/城市 /城镇/村庄名称”:“地址””的格式进行说明的情况。这表示一种事实当具有辖区名称属性的字符串与具有区域/城市/城镇/村庄名称属性的字符串连接时假设为地址属性。如此,对各个字符串分配属性。各种属性定义互相独立,并且该定义从不冲突。另外,假设注册了代表相同属性的多个图案,从而可以承受标记(notation)中的变化。<字符替代处理>下面参考图9中所示的具体流程图描述图8中的用于替代由于与印痕重叠而丢失的字符的处理的细节。在下文中,除了另外说明之外,假设由字符替代处理部实施各个步
马聚ο首先,读取印痕相关数据23 (步骤S901)。然后,将变量Mmax和η初始化(步骤 S902)。另外,使变量长度阵列max_id为空(步骤S903)。然后,通过从步骤S904到步骤S911的处理,选择显示出与在印痕相关数据中包括的客户信息最佳匹配的客户。首先,从客户数据库52中读取未经处理的客户数据(步骤 S904)。然后,配置在印痕相关数据23内的各个字符串的布局(步骤S905)。具体地,如图 4D和4E所示,估计由于印痕而丢失的并且在各个字符串上存在的区域中包括的字符的数量。该估计基于字体大小和空白区域的大小。在图4D和4E中,通过符号“? ”来表示已经确定应该存在字符的区域。另外,将在步骤S904中选择的客户数据与印痕相关数据23中的数据相匹配以计算匹配度Mn (步骤S906)。这样来计算匹配度Mn 当存在大量的匹配字符时匹配度Mn较大,当存在大量的不匹配字符时或当字符的数量不一致时匹配度Mn较小。例如联配评分 (alignment score)等现有技术可以用于计算匹配度。在图4C的示例中,由于在步骤S804 中分配属于图6所示的客户的各种信息的邮政编码、地址、客户名称、代表及电话号码的属性,因此将要分别计算关于以虚线方框标记的属性值(以实线方框标记的属性值)的匹配度。随后,确定Mn是否等于或大于最大值Mmax (步骤S907),并且如果大于,则以Mn更新Mmax (步骤S908)。另外,将此时的值,即表示客户的ID添加到max_id (步骤S909)。这里,如果步骤S903中的比较是相等,则将η添加到max_id,但是如果在步骤S903的比较中 Mn大于Mmax,则丢弃通过max_id保存的内容,并使max_id仅保存η。此后,η增加1(步骤S910)。然后,确定是否对于所有客户数据已执行了匹配(步骤S911),并且如果存在任何未经处理过的客户数据则重复从步骤S904到步骤S910的处理。如果不存在未经处理过的客户数据,则前进到步骤S912,确定Mmax是否大于阈值T (步骤S912)。T是预先定义的常量并是用于确定匹配结果是否充分可信的阈值。如果Mmax大于阈值Τ,则利用评分Mmax的客户数据,即对应于max_id的客户数据来替代由于印痕的去除而丢失的字符串(步骤S913)。如果Mmax等于或小于T,则表示匹配度不够的事实。从而,确定不存在对应的客户数据,并且去除印痕相关数据23内的所有字符串(步骤S914)。在这种情况下,中央处理单元10例如可以在图10的⑶I上显示识别处理失败的事实。从而,可以防止部分被剩下的字符串成为随后搜索过程中的干扰。最后,显示例如图10所示的确认屏幕,并且使用户确认替代或去除的结果(步骤 S915)。在屏幕的上半部,以表格来显示印痕相关数据23和由max_id保存的对应于客户 ID的客户数据,在该表格中通过属性值来将这些数据进行分类。从而,用户能够检查文档图像中的印痕周围的字符串与是被选择作为用于替代的候选者的并且其匹配度最高的客户的每个属性的值的字符串的匹配紧密程度。例如,在文档图像中,客户名称是字符串“AB Sof ration”,其中间具有11个未被识别的字符,并且可以看到候选者1的客户名称是与之匹配的字符串“AB Software Corporation”。另外,在已被选择作为用于替代的候选者的客户的确认屏幕上,以高亮显示由用户指示的客户(在图10的示例中,对候选者1画出阴影)。在屏幕的下半部显示将关于所指示的客户的信息嵌入图像的结果,并且用户能够将其与文档图像一起作为整体进行检查。此外,当用户指示在该屏幕的上半部的表格中显示的某些其他客户时,以高亮显示所指示的客户,并且同时切换在屏幕的下半部与文档图像一起显示的客户信息。通过这样的显示,用户能够确定哪个候选者适于替代。如果用户确定显示适于替代的候选者,则他可以通过按下对话中的“是”按钮来表达同意。如果获取了用户同意,则在客户数据库中反映该处理结果。如果没有获取用户同意,则取消处理。< 结论 >在本发明的实施例中,关于例如图2所示的灰度扫描的商业文档,首先通过应用专利文献3中的技术来识别文档内的印痕的区域,并去除该区域。如果该印痕以与字符串重叠的方式被附加,则也与之一起去除该字符串。随后,通过OCR识别剩余的字符串(没有与印痕重叠的字符串)。作为结果,获得例如图3中所示的数据。然后,如图4A所示,作为具有与被去除的印痕相关的信息的区域切去被去除的印痕周围出现的字符串的块。然后,将已经被切去的该区域内的字符串与保存了与这些字符串相关的信息的数据库进行匹配,从而确定该信息与哪些数据相关。在执行匹配时,将被切去的字符串划分为例如图4C中所示的如邮政编码、地址、客户名称等属性,并将各个属性信息与数据库相比较。例如,以如图6所示的数据格式配置数据库。根据匹配的结果,确定与每个字符串的信息最佳匹配的数据为与该商业文档相关的数据。然后,以数据库中的相关数据替代由于去除印痕区域而丢失的字符。通过执行这样的处理,即使在印痕以与包括客户信息的字符串重叠的方式存在于文档内的情况下,也可以通过使用这些字符串周围的信息自动并准确地获得文档的客户信肩、ο在本实施例中,描述了与印痕重叠的字符串是包括客户信息的字符串的情况。然而,本发明并不局限于与印痕重叠的字符串必须是包括客户信息的字符串,而是可以对于所有种类的字符串执行处理。换句话说,只要通过与数据库的匹配处理可以推断出丢失的字符串,则本发明就可以应用于所有种类的文档。另外,还可以通过实现本实施例的功能的软件的程序代码来实现本发明。在该种情况下,对系统或设备提供记录了程序代码的存储介质,并且系统或设备中的计算机(或 CPU或MPU)读取在存储介质中存储的程序代码。从而,从存储介质读取的程序代码本身将实现前述实施例的功能,并且程序代码本身和记录了程序代码的存储介质构成本发明。作为用于提供这样的程序代码的存储介质,例如可以使用软盘、CD-ROM、DVD-ROM、硬盘、光盘、 磁光盘、⑶-R、磁带、非易失性存储卡、ROM等。此外,基于程序代码的指令,在计算机上运行的OS (操作系统)等可以执行部分或所有的实际处理,并且可以通过这些处理实现前述实施例的功能。另外,在将从存储介质中读取的程序代码写入计算机中的存储器之后,计算机的CPU等可以基于程序代码的指令执行部分或所有的实际处理,并且可以通过这些处理实现前述实施例的功能。另外,可以经由网络来分配实现实施例的功能的软件的程序代码,从而在例如系统或设备中的硬盘或存储器等存储部件或例如CD-RW或CD-R等存储介质中保存该程序,并且当被使用时,系统或设备中的计算机(或CPU或MPU)可以读取在存储部件或存储介质中保存的程序代码并执行该程序代码。附图标记列表
10中央处理单元
20数据存储器
21灰度图像数据
22OCR结果数据
23印痕相关数据
30输入/输出装置
31键盘
32显示装置
33定点装置
40商业文档处理程序
41印痕检测处理部
42OCR处理部
43印痕相关信息区域提取处理部
44属性分类处理部
45字符替代处理部
51文档数据库
52客户数据库
53属性数据库
权利要求
1.一种商业文档处理器,所述商业文档处理器扫描商业文档并执行识别处理,所述商业文档处理器包括印痕检测处理部,用于检测以灰度输入的商业文档中的印痕区域,并从所述商业文档中去除所述印痕区域;印痕相关信息提取处理部,用于提取在已经去除了印痕区域的所述商业文档中的被去除的印痕区域附近存在的字符信息作为印痕相关信息,其中由于所述印痕区域导致部分字符是不清楚的;属性分类处理部,用于识别所提取的所述印痕相关信息的属性;及字符推断处理部,用于参考保存了字符串候选的字符串候选数据库,并基于通过属性分类的所述印痕相关信息来推断与印痕区域重叠并且不清楚的字符串。
2.根据权利要求1所述的商业文档处理器,其中,字符推断处理部用通过推断获得的字符串替代由于印痕区域导致不清楚的部分,并在文档数据库中与以灰度输入的商业文档成对地注册替代有字符串的商业文档数据。
3.根据权利要求2所述的商业文档处理器,进一步包括显示处理部,用于在显示部上显示所述替代有字符串的商业文档数据,其中,当存在用于替代的多个字符串候选时,显示处理部在显示部上显示替代有所述多个字符串候选的多个商业文档数据,并且字符推断处理部在文档数据库中注册多个商业文档数据中的、由用户选择的商业文档数据。
4.根据权利要求1所述的商业文档处理器,其中,印痕相关信息提取处理部提取与客户相关的信息作为印痕相关信息,并且字符推断处理部参考保存了客户信息的客户数据库。
5.根据权利要求3所述的商业文档处理器,其中,字符推断处理部计算在字符串候选数据库中保存的信息和通过属性分类的印痕相关信息之间的匹配度,并且当所述匹配度大于预定值时使字符串候选数据库中的信息成为用于替代的字符串候选。
6.根据权利要求5所述的商业文档处理器,其中,如果所述匹配度等于或小于所述预定值,则字符推断处理部在不用字符替代印痕区域的情况下终止处理。
全文摘要
提供一种用于当对以灰度保存的商业文档应用OCR时即使字符串和印痕互相重叠也在保留字符串信息的同时仅去除印痕的技术。通过将在印痕附近存在的字符串与数据库相匹配来推断与印痕重叠的字符串。更具体地,首先,去除以灰度输入的商业文档中的印痕区域。随后,提取在被去除的印痕区域附近存在的并且由于印痕导致其部分字符不清楚的字符信息作为印痕相关信息。然后,识别所提取的印痕相关信息的属性,参考保存了包括客户信息的字符串候选的客户数据库,并基于通过属性分类的印痕相关信息,推断与印痕区域重叠并因此不清楚的字符串。
文档编号G06K9/34GK102171708SQ20098013878
公开日2011年8月31日 申请日期2009年12月15日 优先权日2008年12月26日
发明者大峡光晴 申请人:日立系统解决方案有限公司

最新回复(0)