一种基于清分机的多国纸币序列号识别方法

xiaoxiao2020-10-23  18

一种基于清分机的多国纸币序列号识别方法
【技术领域】
[0001] 本发明属于自动识别技术领域,特别地涉及一种基于清分机的多国纸币序列号识 别方法,涉及了结合了纸币先验知识的二次分割方法,以及基于模板匹配的字符识别方法。
【背景技术】
[0002] 在金融领域,每张纸币都有一个独一无二的序列号,相当于纸币的身份证,因此序 列号成为纸币的重要标识。无论是分类还是防伪,序列号都起着至关重要的作用。而目前 一些经济纠纷以及非法资金流动的案件数量日益增加,另外还有打击暴力纸币抢劫和洗黑 钱方面,序列号更是国家机器对钞票流动管理的利器,有利于社会稳定。目前国内几家大型 银行的分行和支行大多配备中小型清分机,加上其他银行网点以及ATM配备,清分机的需 求在2010年就已经达到了 10万台,并在持续增长中。此外,经济全球化是发展趋势,现有 的清分机对于外币的鉴别功能需求也日益增长,因此需要对各国纸币的序列号进行识别, 现有的清分机主要实现了对单一币种的序列号识别,限制了应用范围。
[0003] 目前的纸币序列号识别主要有三个步骤,图像预处理、字符分割和字符识别。在现 有技术中,识别主要只针对2005新版人民币,使用范围窄,并且新版人民币背景单一,序列 号识别难度相对较低。现有技术中在字符分割步骤使用了二次分割方法,第一次分割方法 为基于跳变点计算,很容易受到印刷和污染影响,并且对于图像的明暗度非常敏感;第二次 分割为固定阈值的二值化,记录边缘跳变点为分割结果,对明暗敏感,无法处理背景复杂的 纸币,例如美元。在字符归一化使用的是最邻近插值算法,每个像素均需要重新计算灰度, 对于大小较固定的字符该方法降低了效率。在识别方面,目前的方法有两种,方法一是网格 法,将字符划分为数个网格(网格数量为20-40),每个网格有20-30个像素,即每个字符要 处理至少要遍历统计500个像素,虽然精度较高,但是大大牺牲了运算速度;方法二较优, 是基于SVM支持序列机的分类方法,其方法是建立0-9和二十六个数字的三十六个支持序 列机,错误率较低,在2-3%左右,但处理速度慢平均在50-70ms/张,由于入钞、旋转纠正、 摄取序列号图像本身需要40ms的时间,无法达到业内的《GB16999-2010人民币鉴别仪通 用技术条件》中要求的A级清分机的序列号识别速度要求多700 (张/min),平均处理时间 80ms的标准。另外,对于美元纸币背景复杂,欧元号码大小差异极大等问题,现有技术都没 有解决。故针对目前现有技术中存在的上述缺陷,实有必要进行研宄,以提供一种方案,解 决现有技术中存在的缺陷,避免造成纸币序列号识别币种单一,识别速度低,准确率不高的 问题。

【发明内容】

[0004] 为解决上述问题,本发明的目的在于提供了一种基于清分机的多国纸币序列号识 别方法,采用结合了纸币先验知识的二次分割方法,以及基于模板匹配的字符识别方法,解 决了现有纸币序列号识别中不能适应于复杂背景以及字符大小变化问题,同时识别速度提 高了 8倍以上。
[0005] 为实现上述目的,本发明的技术方案为:一种基于清分机的多国纸币序列号识别 方法,该方法为:获得纸币序列号的图像,并把图像转换为灰度图I,然后对灰度图I进行以 下步骤处理:
[0006] 步骤1 :获取不同币种、面值、版本信息的纸币先验信息,所述先验信息为序列号 中各个字符的位置分布;利用先验信息对灰度图进行字符初定位,根据初定位结果对灰度 图进行二值化处理,将二值化后的图像投影后进行再定位;根据再定位结果,对二值化后的 图像进行分割,获得每个字符的再定位二值化矩阵。
[0007] 步骤2,对步骤1得到的再定位二值化矩阵进行字符归一化,得到归一化二值化矩 阵Cn,(;的大小为AXB,与匹配模板集合M中各个子模板的大小相同;所述字符归一化方 法为最近邻插值法或双线性内插法,对于字符形状固定的币种采用最近邻插值法;对于字 符形状变化的币种采用双线性内插法;
[0008] 步骤3 :将Cn分别与匹配模板集合M中各个匹配子模板进行点乘,并对点乘获得乘 积矩阵的各个元素求和,得到元素总和r,若Cn与字符k的匹配子模板Mk点乘时,元素总和 r取得最大值:
,a= 1,2,…,A,b= 1,2,…,B;则k即 为识别结果。
[0009] 进一步地,步骤1中所述的字符初定位,具体包括以下步骤:
[0010] (1. 1)确定纸币序列号字符的竖直方向的起始位置m%11^=argmaxm(y?S);
[0011] 其中,Se『为灰度图I在竖直方向的投影向量,/eIT'Rw表示p行q列的 实数矩阵;s= [SpS^'S/,
,i= 1,2,…,p,Si为投影向量S中第i个元素; y为输入图像在竖直方向的投影信号,y= [yuyD…,yP] ;yi=i+s(i-m-h)-s(i-m),i= 1,2,…,p,s(i)是阶跃信号
,h是序列号中最高字符的高度,通过纸币的先 验f目息确定取值,为已知项;mG[0,p_h]是序列号在竖直方向的起始位置变量。
[0012] (1. 2)确定纸币序列号字符的水平方向的起始位置T,r=argmaxi(x?G);
[0013] 其中,GeR'为输入图像在水平方向的投影向量,G= [Gi,G2,…,Gq]T,
,j= 1,2,…,q,Gj为投影向量G中第j个元素;x为输入图像在水平方向的投 景多信号;x= [x"x2,…,xj;Xj=l+s(j_l_d1-w1)-s(j-l-d1)+s(j-l-d2-w2)-s(j-l_d2)+... +s(j-l-dk-wk)-s(j-l_dk),j= 1,2, ???,q,k是序列号字符的个数,Wpw2,…,wk分别为第 1,2,…,k个字符的宽度。以序列号中第一个字符的左下角为原点,屯,d2,…,dk是序列号上 每个字符左下角位置相对于此原点的距离,屯=0。k、wuw2,…,wk和dpd2,…,dk可通过 纸币的先验信息确定取值。le[0,q-w]是序列号在水平方向的起始位置变量。
[0014] (1. 3)根据第一个字符的初定位位置(r,nf)、屯,d2,…,dk和ww2,…,wk获得序 列号上其它字符的初定位结果,具体为:
[0015] 设第n个字符的初定位位置为:水平方向(xnl,xn2),竖直方向(ynl,yj。其中xn# 该字符水平方向的起始位置,xnl=l*+dn;xn2是该字符水平方向的终止位置,xn2=xnl+wn; ynl是该字符竖直方向的起始位置,ynl=m*;y"2是该字符竖直方向的终止位置,y"2=n^+h。
[0016] 进一步地,步骤1中所述的二值化处理,具体包括以下步骤:
[0017] (1)确定二值化区域,所述二值化区域为第一个字符的水平起始位置Xll到第k 个字符的水平终止位置Xk2,第一个字符的竖直起始位置yil到第一个字符的竖直终止位置 y12,即二值化水平区间为(Xll,xk2),二值化竖直区间为(yil,y12);
[0018] (2)对二值化区域中的字符进行二值化,获得每个字符的初定位二值化矩阵,设第 n个字符的初定位二值化矩阵为凡,其大小为(yn2-ynl)X(Xn2-Xnl)。二值化所使用的阈值通 过双峰法计算得到。
[0019] 进一步地,步骤1中所述的字符再定位,具体包括以下步骤:
[0020] (1)根据字符的初定位二值化矩阵凡对每个字符进行竖直方向投影,得到竖直方 向的离散序列,如对第n个字符得到的竖直 方向离散序列为Wn。对1进行遍历,在满足连续 三个元素均大于设定阈值tnl或一个元素大于设定阈值tn2的第一个元素位置,作为字符的 竖直再定位的起始位置坐标,记为ynl',满足以上两个条件之一的最后一个元素的位置作 为竖直再定位的终止位置坐标,记为7"2';其中1^ 1=0.5¥11,1:112=¥11-3。根据(7 111',7112') 更新每个字符的二值化矩阵,得到新的二值化矩阵凡',大小为( yn2' _ynl' )X(xn2-xnl)。
[0021] (2)根据新的二值化矩阵Nn'对每个字符进行水平方向投影,得到水平方向的离 散序列,如对第n个字符得到的水平方向离散序列为Ln。对Ln?行遍历,在满足连续三 个元素均大于设定阈值tnl'或一个元素大于设定阈值tn2'的第一个元素位置,作为字符 的竖直再定位的起始位置坐标,记为xnl',满足以上两个条件之一的最后一个元素的位 置作为水平再定位的终止位置坐标,记为Xn2';其中tnl' =0.5(yn2' _ynl' = (yj_ynl' )_3。根据Unl',Xn2')更新每个字符的二值化矩阵,得到再定位二值化矩 阵Nn",大小为(yn2' _ynl')X(Xn2' _xnl')。
[0022] 进一步地,步骤3中所述匹配模板集合M通过以下方式得到:
[0023] (1)采样获得某个字符k的U个归一化二值化矩阵Dkl,Dk2,…,Dku,这U个归一化 二值化矩阵采样自不同的纸币序列号或者相同纸币序列号的不同位置。
[0024] 计算统计矩阵
,u= 1,2,…,U,Ak中的值最小为0,最大为U。基于 此建立初步的子模板Mk',具体为:对Ak(W,)彡0. 8U的点),即稠密部分,Mk'(i',j')取 10;对Ak(i',j')彡 0.2U的点(i',j'),即稀疏部分,Mk'(i',j') 取-10;对 0.2。<六^,j,)<0.8U的点(i',j,),Mk'(i,,j,)取0;
[0025] 重复上述步骤,对不同的字符建立相对应的初步的子模板,得到初步的匹配模板 集合M'。
[0026] (2)将初步的匹配模板集合M'与步骤(1)中采样的归一化二值化矩阵进行匹配。 根据匹配结果调整匹配模板集合,具体为:
[0027] 字符k的采样的归一化二值化矩阵Dku与初步的匹配模板集合M'中各 个子模板进行点乘,并对点乘获得乘积矩阵的各个元素求和,得到元素总和r,
,a= 1,2,…,A,b= 1,2,…,B;k'为任一字符;若 k' =k时,Mk'即为字符k的匹配子模板,Mk=Mk';若k辛k',则需调整初步的子模板Mk',方法为:对于初步的子模板Mk'和Mk, ',对于Mk'(i〃,j" ) =Mk, '(i〃,j")的点 a",j"),则Mka",j" ) =Mk,a",j" )-i;对于Mka",j")乒Mk,a",j")的 点a",j"),则Mk(i",j" )=Mk'(i",j" )+l;从而获得匹配模板Mk。
[0028] 重复上述步骤,对不同的字符调整相对应的初步的子模板,得到调整后的匹配模 板集合。
[0029] 本发明的有益效果是:
[0030] (1)利用纸币号码相对位置分布的先验信息的二次分割使分割结果更为准确,并 且避免了噪点的影响,同时可以省略滤波步骤;
[0031] (2)识别中,建立的模板缩小了 150-180个像素,识别耗时是之前方法的1/10,另 外正确率较支持向量机有明显提高,方法灵活,适用于目前主流的多种币种包括人民币、美 元、欧元、港币、日元等。
[0032] (3)与现有技术采用的简单的二次分割以及连通域、支持向量机识别方法相比,本 发明将预处理作为可选过程,分割结果受背景明暗变化小,更贴切字符,可以处理竖排、大 小和字符比例都有剧烈变化的字符;在特征提取方面达到目前最大的字符欧式距离,大大 缩小了模板大小,降低了运算复杂度。
【附图说明】
[0033] 图1为本发明实施例的基于清分机的多国纸币序列号识别方法的步骤流程图;
[0034] 图2为本发明实施例的基于清分机的多国纸币序列号识别方法的分割出的人民 币序列号码图像;
[0035] 图3为本发明实施例的基于清分机的多国纸币序列号识别方法的分割出的美元 序列号码图像;
[0036] 图4为本发明实施例的基于清分机的多国纸币序列号识别方法的分割出的欧元 序列号码图像;
[0037] 图5为本发明实施例的基于清分机的多国纸币序列号识别方法的分割出的港币 序列号码图像;
[0038] 图6为图5中的港币系列号图像经过二次分割后的分割结果示意图;
[0039] 图7为本发明实施例的基于清分机的多国纸币序列号识别方法的字符的稀疏部 分,其稀疏部分分别为上中下;
[0040] 图8为本发明实施例的基于清分机的多国纸币序列号识别方法的字符"3"的再定 位二值化矩阵C3的示意图;
[0041]图9为本发明实施例的基于清分机的多国纸币序列号识别方法建立的字符"3"匹 配模板的示意图。
【具体实施方式】
[0042] 为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对 本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并 不用于限定本发明。
[0043] 相反,本发明涵盖任何由权利要求定义的在本发明的精髓和范围上做的替代、修 改、等效方法以及方案。进一步,为了使公众对本发明有更好的了解,在下文对本发明的细 节描述中,详尽描述了一些特定的细节部分。对本领域技术人员来说没有这些细节部分的 描述也可以完全理解本发明。
[0044] 参考图1,所示为本发明实施例的基于清分机的多国纸币序列号识别方法的步骤 流程图。获得纸币序列号的图像,并把图像转换为灰度图I,如图2至5所示,分别为人民 币、美元、欧元、港币的序列号灰度图图像。然后对I进行以下步骤处理:
[0045] 步骤1 :获取不同币种、面值、版本信息的纸币先验信息,所述先验信息为序列号 中各个字符的位置分布;利用先验信息对灰度图进行字符初定位,根据初定位结果对灰度 图进行二值化处理,将二值化后的图像投影后进行再定位;根据再定位结果,对二值化后的 图像进行分割,获得每个字符的再定位二值化矩阵。如图8所示为字符"3"的再定位二值 化矩阵C3。
[0046] 步骤2,对步骤1得到的再定位二值化矩阵进行字符归一化,得到归一化二值化矩 阵Cn,(;的大小为aXb,aXb为匹配模板集合M中各个子模板的大小;归一化的目的在于: 将识别的灰度图的大小调节成与匹配模板的大小一致。所述字符归一化方法为最近邻插值 法或双线性内插法,对于字符形状固定的币种采用最近邻插值法;对于字符形状变化的币 种采用双线性内插法;归一化得到的特征矩阵Cn的长宽均在12-18 ;
[0047] 步骤3 :将(;和匹配模板集合M中各个子模板进行点乘,并对点乘获得乘积矩阵的 各个元素求和,得到元素总和r,若Cn与字符k的匹配子模板Mk点乘时,元素总和r取得最 大值,即
,a= 1,2,…,A,b= 1,2,…,B;则k即为识别 结果。
[0048] 在具体应用实例中,I可以为8位深度灰度图,大小在64*256至64*320范围内最 佳。
[0049] 步骤1中所述的字符初定位,具体包括以下步骤:
[0050] (1)确定纸币序列号字符的竖 直方向的起始位置m%11^=argmaxm(y?S);
[0051] 其中,SelT为灰度图I在竖直方向的投影向量
表示P行q列的 实数矩阵;s= [Si,S2,…,SP]T,
,i= 1,2,…,p,Si为投影向量S中第i个元素;
[0052] 在另外的应用实例中,为了保证数据不溢出且节省运算时间,将S的每个元素均 除以256作为最后结果,如下式,
[0054]y为输入图像在竖直方向的投影信号,y=[ypy2,…,yp] % = 1+s(i-m-h)_s(i_m),i= 1,2,…,p,s(i)是阶跃彳目号,
,11是序列号中最尚 字符的高度,通过纸币的先验信息确定取值,为已知项;mG[0,p-h]是序列号在竖直方向 的起始位置变量。
[0055] (2)确定纸币序列号字符的水平方向的起始位置1%r=argmaxi(x?G);
[0056] 其中,(^粑为输入图像在水平方向的投影向量,G=叫,匕,…,Gq]T,
j= 1,2,…,q,Gj为投影向量G中第j个元素;x为输入图像在水平方向的投影信 号;x= [x1;x2, ???,xj;Xj= 1+s(j-l-d「wj-S(j-l-dj+s(j-l-d2-w2)-S(j-l-d2)+... +s(j-l-dk-wk)-s(j-l_dk),j= 1, 2, ???,q,k是序列号字符的个数,Wpw2,…,wk分别为第 1,2,…,k个字符的宽度。以序列号中第一个字符的左下角为原点,屯,d2,…,dk是序列号上 每个字符左下角位置相对于此原点的距离,屯=0。k、wuw2,…,wk和dpd2,…,dk可通过 纸币的先验信息确定取值。le[0,q-w]是序列号在水平方向的起始位置变量。
[0057] (3)根据第一个字符的初定位位置(1'nf)、屯,d2,…,4和wuw2,…,wk获得序列 号上其它字符的初定位结果,具体为:
[0058] 设第n个字符的初定位位置为:水平方向(xnl,xn2),竖直方向(ynl,yj。其中xn# 该字符水平方向的起始位置,xnl=l*+dn;xn2是该字符水平方向的终止位置,xn2=xnl+wn; ynl是该字符竖直方向的起始位置,ynl=m*;y&是该字符竖直方向的终止位置,y"2=n^+h。
[0059] 步骤1中所述的二值化处理,具体包括以下步骤:
[0060] (1)确定二值化区域,所述二值化区域为第一个字符的水平起始位置Xll到第k 个字符的水平终止位置Xk2,第一个字符的竖直起始位置yil到第一个字符的竖直终止位置 y12,即二值化水平区间为(Xll,xk2),二值化竖直区间为(yn,y12);
[0061] (2)对二值化区域中的字符进行二值化,获得每个字符的初定位二值化矩阵,设第 n个字符的初定位二值化矩阵为凡,其大小为(yn2_ynl)X(Xn2-Xnl)。二值化所使用的阈值通 过双峰法计算得到。
[0062] 步骤1中所述的字符再定位,具体包括以下步骤:
[0063] (1)根据字符的初定位二值化矩阵凡对每个字符进行竖直方向投影,得到竖直方 向的离散序列,如对第n个字符得到的竖直方向离散序列为Wn。对Wn?行遍历,在满足连续 三个元素均大于设定阈值tnl或一个元素大于设定阈值tn2的第一个元素位置,作为字符的 竖直再定位的起始位置坐标,记为ynl',满足以上两个条件之一的最后一个元素的位置作 为竖直再定位的终止位置坐标,记为7"2';其中1^ 1=0.5¥11,1:112=¥11-3。根据(7 111',7112') 更新每个字符的二值化矩阵,得到新的二值化矩阵凡',大小为( yn2' _ynl' )X(xn2-xnl)。
[0064] (2)根据新的二值化矩阵Nn'对每个字符进行水平方向投影,得到水平方向的离 散序列,如对第n个字符得到的水平方向离散序列为Ln。对Ln?行遍历,在满足连续三 个元素均大于设定阈值tnl'或一个元素大于设定阈值tn2'的第一个元素位置,作为字符 的竖直再定位的起始位置坐标,记为xnl',满足以上两个条件之一的最后一个元素的位 置作为水平再定位的终止位置坐标,记为Xn2';其中tnl' =0.5(yn2' _ynl' = (yj_ynl' )_3。根据Unl',Xn2')更新每个字符的二值化矩阵,得到再定位二值化矩 阵Nn",大小为(yn2' _ynl' )X(xn2' -xnl')。如图6所示为港币的再定位,即二次分割 结果图。
[0065] 步骤3中所述匹配模板集合M通过以下方式得到:
[0066] (1)采样获得某个字符k的U个归一化二值化矩阵Dkl,Dk2,…,Dku,这U个归一化 二值化矩阵可以采样自不同的纸币序列号或者相同纸币序列号的不同位置。
[0067] 计算统计矩阵
,u= 1,2,…,U,Ak中的值最小为0,最大为U。基于 此建立初步的子模板Mk,具体为:对Ak(P,_T)彡0.8U的点,_T),即稠密部分,Mk(y,_r)取1〇;对Ak(y,_r)彡〇.2u的点,_r),即稀疏部分,如图7所示, Mk(i',j')取-10;对O^USAka',j' )<0.8U的点(i',j' ),Mk(i',j')取 0 ;
[0068] 重复上述步骤,对不同的字符建立相对应的初步的子模板,得到初步的匹配模板 集合M。初步的匹配模板集合M包含了 36个子模板,分别为0-9十个数字和A-Z二十六个 大写字母。
[0069] (2)将初步的匹配模板集合M与(1)中采样的归一化二值化矩阵进行匹配。根据 匹配结果来调整匹配模板集合M。具体为:
[0070] 字符k的采样的归一化二值化矩阵Dku与初步的匹配模板集合M中各 个子模板进行点乘,并对点乘获得乘积矩阵的各个元素求和,得到元素总和r,
a= 1,2,…,A,b= 1,2,…,B;k'为任一字符;若 k' =k时,Mk'即为字符k的匹配子模板,Mk=Mk' ;若k辛k',则需调整初步的子模板Mk',方法为:对于初步的子模板Mk'和Mk, ',对于Mk'(i〃,j" ) =Mk, '(i〃,j")的点 a",j"),则Mka",j" ) =Mk,a",j" )-i;对于Mka",j")乒Mk,a",j")的 点a",j"),则Mk(i",j" )=Mk'(i",j" )+l;从而获得匹配模板Mk。
[0071] 重复上述步骤,对不同的字符调整相对应的初步的子模板,得到调整后的匹配模 板集合。
[0072] 如图9所示为字符"3"进行调整后的最终模板。
[0073] 以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精 神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。
【主权项】
1. 一种基于清分机的多国纸币序列号识别方法,其特征在于,该方法为:获得纸币序 列号的图像,并把图像转换为灰度图I,然后对灰度图I进行以下步骤处理: 步骤1 :获取不同币种、面值、版本信息的纸币先验信息,所述先验信息为序列号中各 个字符的位置分布;利用先验信息对灰度图进行字符初定位,根据初定位结果对灰度图进 行二值化处理,将二值化后的图像投影后进行再定位;根据再定位结果,对二值化后的图像 进行分割,获得每个字符的再定位二值化矩阵。 步骤2,对步骤1得到的再定位二值化矩阵进行字符归一化,得到归一化二值化矩阵 Cn,CM大小为AXB,与匹配模板集合M中各个子模板 的大小相同;所述字符归一化方法为 最近邻插值法或双线性内插法,对于字符形状固定的币种采用最近邻插值法;对于字符形 状变化的币种采用双线性内插法; 步骤3 :将Cn分别与匹配模板集合M中各个匹配子模板进行点乘,并对点乘获得乘积矩 阵的各个元素求和,得到元素总和r,若Cn与字符k的匹配子模板M k点乘时,元素总和r取 得最大值,,a = l,2,一,A,b = 1,2,···,Β;则k 即为 识别结果。2. 根据权利要求1所述的方法,其特征在于,步骤1中所述的字符初定位,具体包括以 下步骤: (1) 确定纸币序列号字符的竖直方向的起始位置m% nf = argmax m (y · S);其中, S e IT为灰度图I在竖直方向的投影向量,/ e Κ",表示p行q列的实数矩阵;S = [S1, S2,…,Sp]τ,1 i = 1,2,…,p,Si为投影向量S中第i个元素;y为输入图像在竖直方向的投影信号,y= [Yuy2^syp]; Yi= l+s(i-m-h)-s(i-m),i = 1,2,…,p,s(i)是阶跃信号, ,h 是序列 号中最高字符的高度,通过纸币的先验信息确定取值,为已知项;m e [〇,p-h]是序列号在 竖直方向的起始位置变量。 (2) 确定纸币序列号字符的水平方向的起始位置Γ,Γ= argmax Jx · G); 其中,为输入图像在水平方向的投影向量,G = [G1, G2,…,Gq]T,j = 1,2, ···,(!,Gj为投影向量G中第j个元素;X为输入图像在水平方向的投影信 号;X = [x1; X2, ···, Xq] ;Xj= 1+s (j-1-d !-W1)-S (j-1-dj+S (j-1-d2-w2)-S (j_l_d2)+… +s(j-1-dk-wk)-s(j-l_dk),j = I, 2,…,q,k是序列号字符的个数,W1, W2,…,wk分别为第 1,2,…,k个字符的宽度。以序列号中第一个字符的左下角为原点,屯,d2,…,dk是序列号上 每个字符左下角位置相对于此原点的距离,(I1= 0。k、w u W2,…,Wk和d p d2,…,dk可通过 纸币的先验信息确定取值。le [〇,q-w]是序列号在水平方向的起始位置变量。 (3) 根据第一个字符的初定位位置(Γ,π〇、Cl1, d2,…,4和w i,W2,…,Wk获得序列号上 其它字符的初定位结果,具体为: 设第η个字符的初定位位置为:水平方向(xnl, Xn2),竖直方向(ynl, yn2)。其中Xnl是该 字符水平方向的起始位置,Xnl= l*+dn;xn2是该字符水平方向的终止位置,Xn2= xnl+wn;ynl是该字符竖直方向的起始位置,ynl= m* Wn2是该字符竖直方向的终止位置,Yn2= n^+h。3. 根据权利要求1所述的方法,其特征在于,步骤1中所述的二值化处理,具体包括以 下步骤: (1) 确定二值化区域,所述二值化区域为第一个字符的水平起始位置X11到第k个字符 的水平终止位置xk2,第一个字符的竖直起始位置yn到第一个字符的竖直终止位置y 12,即 二值化水平区间为(Xll,xk2),二值化竖直区间为(yn,y 12); (2) 对二值化区域中的字符进行二值化,获得每个字符的初定位二值化矩阵,设第η个 字符的初定位二值化矩阵为Nn,其大小为(yn2_ynl) X (Xn2-Xnl)。二值化所使用的阈值通过双 峰法计算得到。4. 对于权利要求1所述的方法,其特征在于,步骤1中所述的字符再定位,具体包括以 下步骤: (1) 根据字符的初定位二值化矩阵凡对每个字符进行竖直方向投影,得到竖直方向的 离散序列,如对第η个字符得到的竖直方向离散序列为Wn。对Wn?行遍历,在满足连续三 个元素均大于设定阈值tnl或一个元素大于设定阈值t &的第一个元素位置,作为字符的竖 直再定位的起始位置坐标,记为ynl',满足以上两个条件之一的最后一个元素的位置作为 竖直再定位的终止位置坐标,记为yn2';其中tnl=0. Sw1^tn2=Wn-Stl根据(ynl' ,Yn2') 更新每个字符的二值化矩阵,得到新的二值化矩阵凡',大小为(yn2' _ynl' )X(xn2-xnl)。 (2) 根据新的二值化矩阵Nn'对每个字符进行水平方向投影,得到水平方向的离散 序列,如对第η个字符得到的水平方向离散序列为Ln。对Ln?行遍历,在满足连续三个 元素均大于设定阈值tnl'或一个元素大于设定阈值tn2'的第一个元素位置,作为字符 的竖直再定位的起始位置坐标,记为Xnl',满足以上两个条件之一的最后一个元素的位 置作为水平再定位的终止位置坐标,记为Xn2';其中tnl' =0.5(yn2' -ynl' Ltn2'= (yj _ynl' )_3。根据Unl',Xn2')更新每个字符的二值化矩阵,得到再定位二值化矩 阵 Nn",大小为(yn2' _ynl')X(x"2' _xnl')。5. 根据权利要求1所述的方法,其特征在于,步骤3中所述匹配模板集合M通过以下方 式得到: (1) 采样获得某个字符k的U个归一化二值化矩阵Dkl,Dk2,…,Dku,这U个归一化二值 化矩阵采样自不同的纸币序列号或者相同纸币序列号的不同位置。 计算统计矩阵,u = 1,2,···,υ,Ak中的值最小为0,最大为U。基于 此建立初步的子模板M1/,具体为:对Ak(P,介)彡0.8U的点,_Γ ),即稠密 部分,M1/ (Ρ,_Γ )取10;对Ak(P,_T )<0.2U的点,介),即稀疏部分, Mk' (i,,j,)取-10;对O^UCAka',j,)<0.8U 的点(i',j,),Mk' (i,,j,) 取〇 ; 重复上述步骤,对不同的字符建立相对应的初步的子模板,得到初步的匹配模板集合 Mr 〇 (2) 将初步的匹配模板集合M'与步骤(1)中采样的归一化二值化矩阵进行匹配。根 据匹配结果调整匹配模板集合,具体为: 字符k的采样的归一化二值化矩阵Dku与初步的匹配模板集合IT中各 个子模板进行点乘,并对点乘获得乘积矩阵的各个元素求和,得到元素总和r,,a=l,2,~,A,b = l,2,~,B;l^ 为任一字符;若V =k时,Mk'即为字符k的匹配子模板,Mk=Mk';若k乒k',则需调整初步的子模板M k', 方法为:对于初步的子模板M1/和Mk^,对于M1/ (i",j" ) =Mk^ (i",j")的点 (i",j"),则 Mk(i",j" ) =Mk' (i",j" )-1 ;对于 Mk(i",j")辛 Mk, (i",j") 的点(i",j"),则 Mk(i",j" )=Mk' (i",j" )+1;从而获得匹配模板 Mk。 重复上述步骤,对不同的字符调整相对应的初步的子模板,得到调整后的匹配模板集 合。
【专利摘要】本发明实施例公开了一种基于清分机的多国纸币序列号识别方法,该方法通过字符的匹配模板对待识别的字符进行识别。首先将获得纸币序列号的图像转换为灰度图后,通过初定位、二值化、再定位来确定字符的识别区域,然后通过归一下使得该字符的区域大小与匹配模板大小一致,再通过点乘筛选出匹配的字符,完成识别。该方法不仅避免了噪点的影响,同时可以省略滤波步骤;适用于目前主流的多种币种包括人民币、美元、欧元、港币、日元等。
【IPC分类】G07D7/20
【公开号】CN104899965
【申请号】CN201510251098
【发明人】于慧敏, 施成燕, 李伊清
【申请人】浙江大学
【公开日】2015年9月9日
【申请日】2015年5月15日

最新回复(0)