一种数据库蜜罐中姓名字段的构造方法及系统的制作方法
【技术领域】
[0001]本发明涉及信息安全技术领域,尤其涉及一种数据库蜜罐中姓名字段的构造方法及系统。
【背景技术】
[0002]当前网络安全检测手段中,均采用已知攻击特征码的机制,或带有行为分析沙箱的技术,对已知和未知威胁进行检测。而面对带有针对性的攻击和带有加密传输的协议时,往往缺少足够的检测手段。蜜罐技术可以更为合理地解决这类问题,通过部署在用户现场的蜜罐,诱使黑客攻击蜜罐,达到检测攻击和攻击过程的目的。
[0003]而当前蜜罐技术的演进,因缺少丰富的数据而导致黑客只做了初步的入侵即可分辨目标是否为蜜罐而导致放弃后续攻击,从而丧失了蜜罐对正常业务系统的持续性保护和攻击行为取证的目的。
[0004]应用级数据库蜜罐在数据的仿业务系统的能力上较之前低交互和高交互型的蜜罐进一步演进,从某种程度上已经极大的解决了对正常业务系统的未知威胁的有效识别的问题。
[0005]面向数据库的应用级蜜罐在数据的构造能力上,已经达到了较为通用的,自动化的能力,但在更好的构造用户业务场景方面,还存在不足。如果蜜罐中的用户姓名被恶意公开,从而导致泄露单位与个人的隐私是不合适的。但随机构造的数据显然无法被攻击者所认可,无意义的内容会被攻击者认为是测试数据或蜜罐,从而导致转向寻找正常的业务系统。
【发明内容】
[0006]本发明提供了一种数据库蜜罐中姓名字段的构造方法及系统,该发明所述的技术方案主要考虑构造姓名的合理性和构造姓名虚拟性的可验证,从而解决传统姓名构造方法存在的不合理性,从而引起攻击者怀疑的问题。同时,本发明所述技术方案构造的姓名,即使被恶意公开,也可以通过预设的姓名构造公式来验证其虚拟性,并非真实用户姓名,从而避免引起用户不满。
[0007]本发明采用如下方法来实现:一种数据库蜜罐中姓名字段的构造方法,包括:
选取百家姓中的姓氏作为元素构建姓候选集;
选取互联网中使用频度高的名字中的字或者褒义词典中的字作为元素构建名候选集;
设定姓候选集和名候选集中各元素的待统计项目,并计算各元素的待统计项目的统计值;
基于设定的待统计项目生成姓名构造公式;
选取统计值满足所述姓名构造公式的各元素构造姓名;
将构造的姓名填充至蜜罐的姓名字段; 若蜜罐的姓名字段被恶意公开,则利用所述姓名构造公式验证该姓名字段为虚拟构造。
[0008]进一步地,所述待统计项目为姓候选集和名候选集中各元素的笔划数、声母序号、韵母序号和声调序号。
[0009]进一步地,所述待统计项目为姓候选集和名候选集中各元素在选定字典中所在的页数和行数。
[0010]进一步地,所述待统计项目为姓候选集和名候选集中各元素在五笔字型码表中的序号。
[0011]更进一步地,所述选取统计值满足所述姓名构造公式的各元素构造姓名为:选取统计值满足所述姓名构造公式的各元素,并将来自于姓候选集的元素作为姓氏,将来自于名候选集的元素作为名。
[0012]本发明采用如下系统来实现:一种数据库蜜罐中姓名字段的构造系统,包括: 姓候选数据库,用于存储百家姓中的姓氏;
名候选数据库,用于存储互联网中使用频度高的名字中的字或者褒义词典中的字;待统计项目计算模块,用于设定姓候选数据库和名候选数据库中各元素的待统计项目,并计算各元素的待统计项目的统计值;
姓名构造模块,用于基于设定的待统计项目生成姓名构造公式,选取统计值满足所述姓名构造公式的各元素构造姓名;
姓名字段填充模块,用于将构造的姓名填充至蜜罐的姓名字段。
[0013]进一步地,所述待统计项目为姓候选集和名候选集中各元素的笔划数、声母序号、韵母序号和声调序号。
[0014]进一步地,所述待统计项目为姓候选集和名候选集中各元素在选定字典中所在的页数和行数。
[0015]进一步地,所述待统计项目为姓候选集和名候选集中各元素在五笔字型码表中的序号。
[0016]更进一步地,所述选取统计值满足所述姓名构造公式的各元素构造姓名为:选取统计值满足所述姓名构造公式的各元素,并将来自于姓候选集的元素作为姓氏,将来自于名候选集的元素作为名。
[0017]综上所述,本发明提供了一种数据库蜜罐中姓名字段的构造方法及系统,通过选取百家姓构建姓候选集,选取适于作为名的字构建名候选集,并对于姓候选集和名候选集中的每个元素设定待统计项目,并计算各元素的所有待统计项目的统计值;基于待统计项目生成姓名构造公式;从而选取统计值满足所述姓名构造公式的各元素来构造姓名。如果利用该姓名构造公式构造的姓名被恶意公开,可以通过公开使用的姓名构造公式来验证被公开数据为虚拟构造,从而避免丢失用户的信任。
[0018]本发明所公开的技术方案由于借鉴了“百家姓”作为姓候选集,选取互联网中使用频度高的名字中的字或者褒义词典中的字作为名候选集,从而使得构造出来的姓名更加的真实可信,有利于引导攻击者进行进一步的操作;同时,由于本发明的技术方案设定了姓名构造公式,统一利用该公式构造姓名,从而当所述姓名被恶意公开后,可以通过当时选用的姓名构造公式来验证这些姓名都满足同一个公式,是虚拟构造的,并非真实数据。
【附图说明】
[0019]为了更清楚地说明本发明的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0020]图1为本发明提供的一种数据库蜜罐中姓名字段的构造方法实施例流程图;
图2为本发明提供的一种数据库蜜罐中姓名字段的构造系统实施例结构图。
【具体实施方式】
[0021]本发明给出了一种数据库蜜罐中姓名字段的构造方法及系统,为了使本技术领域的人员更好地理解本发明实施例中的技术方案,并使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图对本发明中技术方案作进一步详细的说明:
本发明首先提供了一种数据库蜜罐中姓名字段的构造方法实施例,如图1所示,包括:S101选取百家姓中的姓氏作为元素构建姓候选集;使得选取的姓氏更加真实可信;S102选取互联网中使用频度高的名字中的字或者褒义词典中的字作为元素构建名候选集;使得选取的名更加真实可信;
S103设定姓候选集和名候选集中各元素的待统计项目,并计算各元素的待统计项目的统计值;
其中,可以将各元素的待统计项目的统计值补充至姓候选集和名候选集中相应元素后;
S104基于设定的待统计项目生成姓名构造公式;
其中,所述姓名构造公式将待统计项目作为自变量,姓名构造公式本身并不唯一,只要保证后期可验证即可;
S105选取统计值满足所述姓名构造公式的各元素构造姓名;
S106将构造的姓名填充至蜜罐的姓名字段;
S107若蜜罐的姓名字段被恶意公开,则利用所述姓名构造公式验证该姓名字段为虚拟构造。
[0022]其中,所述利用所述姓名构造公式验证该姓名字段为:公开所使用的姓名构造公式,并验证所有已公开的姓名字段中的名字都使用该公式统一构造,并非真实用户姓名。
[0023]其中,在从姓候选集中选取元素时,以百
家姓的顺序设定优先级;在从名候选集中选取元素时,以互联网姓名中字的使用频度设定优先级。
[0024]优选地,所述待统计项目为姓候选集和名候选集中各元素的笔划数、声母序号、韵母序号和声调序号。
[0025]例如:各元素的笔划数为N,声母序号为U,韵母序号为Μ和声调序号为T;则各元素都有四个待统计项目,若构造三个字的名字为xyz,x[N,U,M,T],y[N,U,M,T],z [N, U, Μ, T];
其中,所述N由各元素的笔划数决定;每个元素的声母对应一个声母序号U,所有声母序号从1向后排序;每个元素的韵母对应一个韵母序号M,所有韵母序号从1向后排序;所述T根据各元素的声调决定取值1、2、3或4 ; 其中,名的最后一个字可以选择避免声调为三声;如果姓名整体为三个字,则可以避免中间一个字的声调为四声。
[0026]优选地,所述待统计项目为姓候选集和名候选集中各元素在选定字典中所在的页数和行数。
[0027]优选地,所述待统计项目为姓候选集和名候选集中各元素在五笔字型码表中的序号。
[0028]更为优选地,所述选取统计值满足所述姓名构造公式的各元素构造姓名为:选取统计值满足所述姓名构造公式的各元素,并将来自于姓候选集的元素作为姓氏,将来自于名候选集的元素作为名。
[0029]例如:所述姓名构造公式可以是,但并不限于此:
[(xN*xU*xM*xT)+(yN*yU*yM*yT)+(zN*zU*zM*zT)]%10=8;
即各元素的四个待统计项目的统计值相乘后相加,获得的和值除以10后余数为8 ;其中,数字8为校验值,可以根据需要选取,并不唯一。
[0030]本发明还提供了一种数据库蜜罐中姓名字段的构造系统实施例,如图2所示,包括:
姓候选数据库201,用于存储百家姓中的姓氏;
名候选数据库202,用于存储互联网中使用频度高的名字中的字或者褒义词典中的字;
待统计项目计算模块203,用于设定姓候选数据库201和名候选数据库202中各元素的待统计项目,并计算各元素的待统计项目的统计值;
姓名构造模块204,用于基于设定的待统计项目生成姓名构造公式,选取所述统计值满足所述姓名构造公式的各元素构造姓名;
姓名字段填充模块205,用于将构造的姓名填充至蜜罐的姓名字段。
[0031]优选地,所述待统计项目为姓候选集和名候选集中各元素的笔划数、声母序号、韵母序号和声调序号。
[0032]优选地,所述待统计项目为姓候选集和名候选集中各元素在选定字典中所在的页数和行数。
[0033]优选地,所述待统计项目为姓候选集和名候选集中各元素在五笔字型码表中的序号。
[0034]更为优选地,所述选取统计值满足所述姓名构造公式的各元素构造姓名为:选取统计值满足所述姓名构造公式的各元素,并将来自于姓候选集的元素作为姓氏,将来自于名候选集的元素作为名。
[0035]如上所述,本发明给出了一种数据库蜜罐中姓名字段的构造方法及系统实施例,传统的蜜罐因为缺少丰富的业务数据,从而使得攻击者很容易确定攻击目标是蜜罐,从而放弃后续攻击,重新寻找真实的业务系统。如果将真实的用户姓名复制到蜜罐中,一旦被恶意公开也会对用户造成一定的困扰。本发明所给出的实施例可以解决上述技术问题,通过设定姓候选集和名候选集使得构造的姓名更真实更可信,更容易迷惑攻击者;其次,本发明在姓名构造之前设定姓名构造公式,该公式中的输入项为姓候选集和名候选集中的各元素的待统计项的统计值,找到符合该姓名构造公式的各元素,则完成姓名构造,将姓名填充至蜜罐的姓名字段;最后,一旦该姓名字段被恶意公开,也可以通过公开预设的姓名构造公式来验证这些姓名是基于同一个公式虚拟构造的,并非真实的姓名。
[0036]以上实施例用以说明而非限制本发明的技术方案。不脱离本发明精神和范围的任何修改或局部替换,均应涵盖在本发明的权利要求范围当中。
【主权项】
1.一种数据库蜜罐中姓名字段的构造方法,其特征在于,包括: 选取百家姓中的姓氏作为元素构建姓候选集; 选取互联网中使用频度高的名字中的字或者褒义词典中的字作为元素构建名候选集; 设定姓候选集和名候选集中各元素的待统计项目,并计算各元素的待统计项目的统计值; 基于设定的待统计项目生成姓名构造公式; 选取统计值满足所述姓名构造公式的各元素构造姓名; 将构造的姓名填充至蜜罐的姓名字段; 若蜜罐的姓名字段被恶意公开,则利用所述姓名构造公式验证该姓名字段为虚拟构造。2.如权利要求1所述的方法,其特征在于,所述待统计项目为姓候选集和名候选集中各元素的笔划数、声母序号、韵母序号和声调序号。3.如权利要求1所述的方法,其特征在于,所述待统计项目为姓候选集和名候选集中各元素在选定字典中所在的页数和行数。4.如权利要求1所述的方法,其特征在于,所述待统计项目为姓候选集和名候选集中各元素在五笔字型码表中的序号。5.如权利要求1至4中任一权利要求所述的方法,其特征在于,所述选取统计值满足所述姓名构造公式的各元素构造姓名为:选取统计值满足所述姓名构造公式的各元素,并将来自于姓候选集的元素作为姓氏,将来自于名候选集的元素作为名。6.一种数据库蜜罐中姓名字段的构造系统,其特征在于,包括: 姓候选数据库,用于存储百家姓中的姓氏; 名候选数据库,用于存储互联网中使用频度高的名字中的字或者褒义词典中的字;待统计项目计算模块,用于设定姓候选数据库和名候选数据库中各元素的待统计项目,并计算各元素的待统计项目的统计值; 姓名构造模块,用于基于设定的待统计项目生成姓名构造公式,选取统计值满足所述姓名构造公式的各元素构造姓名; 姓名字段填充模块,用于将构造的姓名填充至蜜罐的姓名字段。7.如权利要求6所述的系统,其特征在于,所述待统计项目为姓候选集和名候选集中各元素的笔划数、声母序号、韵母序号和声调序号。8.如权利要求6所述的系统,其特征在于,所述待统计项目为姓候选集和名候选集中各元素在选定字典中所在的页数和行数。9.如权利要求6所述的系统,其特征在于,所述待统计项目为姓候选集和名候选集中各元素在五笔字型码表中的序号。10.如权利要求6至9中任一权利要求所述的系统,其特征在于,所述选取统计值满足所述姓名构造公式的各元素构造姓名为:选取统计值满足所述姓名构造公式的各元素,并将来自于姓候选集的元素作为姓氏,将来自于名候选集的元素作为名。
【专利摘要】本发明公开了一种数据库蜜罐中姓名字段的构造方法,首先,构建姓候选集和名候选集;设定姓候选集和名候选集中各元素的待统计项目,并计算各元素的待统计项目的统计值;基于设定的待统计项目生成姓名构造公式;选取所述统计值满足所述姓名构造公式的各元素构造姓名;将构造的姓名填充至蜜罐的姓名字段;若蜜罐的姓名字段被恶意公开,则利用所述姓名构造公式验证该姓名字段为虚拟构造。本发明还公开了一种数据库蜜罐中姓名字段的构造系统。本发明所述的技术方案能够完成对于数据库蜜罐中姓名字段的自动填充,既不影响姓名字段的可信度,又避免将真实用户姓名公开。
【IPC分类】G06F17/30, G06F21/60
【公开号】CN105488083
【申请号】CN201410740109
【发明人】王维, 李柏松
【申请人】哈尔滨安天科技股份有限公司
【公开日】2016年4月13日
【申请日】2014年12月8日