一种钓鱼网站的识别方法及装置的制造方法

xiaoxiao2021-2-23 122

一种钓鱼网站的识别方法及装置的制造方法
【专利说明】一种钓鱼网站的识别方法及装置
[0001]
技术领域
[0002]本发明涉及一种钓鱼网站的识别方法及装置。
[0003]
【背景技术】
[0004]钓鱼网站通常指伪装成银行及电子商务，窃取用户提交的银行帐号、密码等私密信息的网站，可用电脑管家进行查杀。“钓鱼”是一种网络欺诈行为，指不法分子利用各种手段，仿冒真实网站的URL地址以及页面内容，或利用真实网站服务器程序上的漏洞在站点的某些网页中插入危险的HTML代码，以此来骗取用户银行或信用卡账号、密码等私人资料。
[0005]“钓鱼网站”的频繁出现，严重地影响了在线金融服务、电子商务的发展危害公众利益，影响公众应用互联网的信心。钓鱼网站通常伪装成为银行网站，窃取访问者提交的账号和密码信息给人们的生活带来了很大的不便，严重威胁了人们的财产安全。
[0006]针对相关技术中的问题，目前尚未提出有效的解决方案。
[0007]

【发明内容】

[0008]本发明的目的是提供一种钓鱼网站的识别方法及装置，以克服目前现有技术存在的上述不足。
[0009]本发明的目的是通过以下技术方案来实现:
一种钓鱼网站的识别方法，包括如下步骤:
接收所有待测网站的访问请求，解析该待测网站的DNS信息和域名信息；
根据常见支付网站和金融网站的域名信息和DNS信息生成基准数据库，并且对基准数据库中的域名信息和DNS信息进行黑名单和白名单的标记；
将待测网站中的域名信息和基准数据库中的域名信息进行比较，当待测网站中的域名信息在基准数据库中显示为黑名单标记则判断该待测网站为钓鱼网站。
[0010]进一步的，在进行钓鱼网站的判断之前还需要确定该待测网站的域名信息是否在基准数据库中，带待测网站的域名信息不在基准数据库中的时候还需要进行如下步骤:
根据常见的英文单词、机构简写、以及各种专业术语生成数据词典，利用编辑距离算法对域名和所述字典的相似性进行的分析，进而确定仿冒域名，并且将该仿冒域名便携到基准数据库中，并且将该域名信息标记为黑名单。
[0011 ]进一步的，利用编辑距离算法的分析包括如下步骤:
查找编辑距离为1的候选词条，对所述待测网站中的异常点数，字符编码、域名申请的时间以及域名过期的时间进行深度检测并且对域名的whois进行分析进而确定该待测网站的域名是否为仿冒域名。
[0012]—种钓鱼网站的识别装置，包括信息解析装置、基准数据库处理装置以及钓鱼网站判断装置，其中:
信息解析装置:用于接收所有待测网站的访问请求，解析该待测网站的DNS信息和域名信息；
基准数据库处理装置:用于根据常见支付网站和金融网站的域名信息和DNS信息生成基准数据库，并且对基准数据库中的域名信息和DNS信息进行黑名单和白名单的标记；
钓鱼网站判断装置:用于将待测网站中的域名信息和基准数据库中的域名信息进行比较，当待测网站中的域名信息在基准数据库中显示为黑名单标记则判断该待测网站为钓鱼网站。
[0013]本发明的有益效果为:本发明的钓鱼网站识别方法基于域名相似度进行识别，具有良好的实时性，能够应用于多种场合，同时深度检测弥补了基于URL检测的正确率不足的问题，并将深度检测的结果返回到对比数据库，提高了钓鱼网站识别的正确率，同时，通过信息积累，也提高了钓鱼网站识别的正确率。
[0014]
【附图说明】
[0015]为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。
[0016]图1是根据本发明实施例的钓鱼网站的识别方法的流程图。
[0017]
【具体实施方式】
[0018]下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员所获得的所有其他实施例，都属于本发明保护的范围。
[0019]如图1所示，根据本发明的实施例所述的一种钓鱼网站的识别方法，其特征在于，包括如下步骤:
接收所有待测网站的访问请求，解析该待测网站的DNS信息和域名信息；
根据常见支付网站和金融网站的域名信息和DNS信息生成基准数据库，并且对基准数据库中的域名信息和DNS信息进行黑名单和白名单的标记；
将待测网站中的域名信息和基准数据库中的域名信息进行比较，当待测网站中的域名信息在基准数据库中显示为黑名单标记则判断该待测网站为钓鱼网站。
[0020]进一步的；在进行钓鱼网站的判断之前还需要确定该待测网站的域名信息是否在基准数据库中，带待测网站的域名信息不在基准数据库中的时候还需要进行如下步骤:
根据常见的英文单词、机构简写、以及各种专业术语生成数据词典，利用编辑距离算法对域名和所述字典的相似性进行的分析，进而确定仿冒域名，并且将该仿冒域名便携到基准数据库中，并且将该域名信息标记为黑名单。
[0021]进一步的，利用编辑距离算法的分析包括如下步骤:
查找编辑距离为1的候选词条，对所述待测网站中的异常点数，字符编码、域名申请的时间以及域名过期的时间进行深度检测并且对域名的whois进行分析进而确定该待测网站的域名是否为仿冒域名。
[0022]一种钓鱼网站的识别装置，包括信息解析装置、基准数据库处理装置以及钓鱼网站判断装置，其中:
信息解析装置:用于接收所有待测网站的访问请求，解析该待测网站的DNS信息和域名信息；
基准数据库处理装置:用于根据常见支付网站和金融网站的域名信息和DNS信息生成基准数据库，并且对基准数据库中的域名信息和DNS信息进行黑名单和白名单的标记；
钓鱼网站判断装置:用于将待测网站中的域名信息和基准数据库中的域名信息进行比较，当待测网站中的域名信息在基准数据库中显示为黑名单标记则判断该待测网站为钓鱼网站。
[0023]综上所述，借助于本发明的上述技术方案，本发明的钓鱼网站识别方法基于域名相似度进行识别，具有良好的实时性，能够应用于多种场合，同时深度检测弥补了基于URL检测的正确率不足的问题，并将深度检测的结果返回到对比数据库，提高了钓鱼网站识别的正确率，同时，通过信息积累，也提高了钓鱼网站识别的正确率。
[0024]以上所述仅为本发明的较佳实施例而已，并不用以限制本发明，凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。
【主权项】
1.一种钓鱼网站的识别方法，其特征在于，包括如下步骤: 接收所有待测网站的访问请求，解析该待测网站的DNS信息和域名信息；根据常见支付网站和金融网站的域名信息和DNS信息生成基准数据库，并且对基准数据库中的域名信息和DNS信息进行黑名单和白名单的标记；将待测网站中的域名信息和基准数据库中的域名信息进行比较，当待测网站中的域名信息在基准数据库中显示为黑名单标记则判断该待测网站为钓鱼网站。2.根据权利要求1所述的钓鱼网站的识别方法，其特征在于;在进行钓鱼网站的判断之前还需要确定该待测网站的域名信息是否在基准数据库中，带待测网站的域名信息不在基准数据库中的时候还需要进行如下步骤: 根据常见的英文单词、机构简写、以及各种专业术语生成数据词典，利用编辑距离算法对域名和所述字典的相似性进行的分析，进而确定仿冒域名，并且将该仿冒域名便携到基准数据库中，并且将该域名信息标记为黑名单。3.根据权利要求2所述的钓鱼网站的识别方法，其特征在于，利用编辑距离算法的分析包括如下步骤: 查找编辑距离为1的候选词条，对所述待测网站中的异常点数，字符编码、域名申请的时间以及域名过期的时间进行深度检测并且对域名的whois进行分析进而确定该待测网站的域名是否为仿冒域名。4.一种钓鱼网站的识别装置，其特征在于，包括信息解析装置、基准数据库处理装置以及钓鱼网站判断装置，其中: 信息解析装置:用于接收所有待测网站的访问请求，解析该待测网站的DNS信息和域名信息；基准数据库处理装置:用于根据常见支付网站和金融网站的域名信息和DNS信息生成基准数据库，并且对基准数据库中的域名信息和DNS信息进行黑名单和白名单的标记；钓鱼网站判断装置:用于将待测网站中的域名信息和基准数据库中的域名信息进行比较，当待测网站中的域名信息在基准数据库中显示为黑名单标记则判断该待测网站为钓鱼网站。
【专利摘要】本发明公开了一种钓鱼网站的识别方法，包括如下步骤：解析该待测网站的DNS信息和域名信息；生成基准数据库，并且对基准数据库中的域名信息和DNS信息进行黑名单和白名单的标记；将待测网站中的域名信息和基准数据库中的域名信息进行比较，当待测网站中的域名信息在基准数据库中显示为黑名单标记则判断该待测网站为钓鱼网站。本发明的有益效果为：本发明的钓鱼网站识别方法基于域名相似度进行识别，具有良好的实时性，能够应用于多种场合，同时深度检测弥补了基于URL检测的正确率不足的问题，并将深度检测的结果返回到对比数据库，提高了钓鱼网站识别的正确率，同时，通过信息积累，也提高了钓鱼网站识别的正确率。
【IPC分类】H04L29/06, H04L29/12
【公开号】CN105491033
【申请号】CN201510857043
【发明人】储来斌
【申请人】睿峰网云（北京）科技股份有限公司
【公开日】2016年4月13日
【申请日】2015年11月30日

2012-2014专利技术

最新回复(0)