本发明涉及网络分析,特别是涉及一种无线网ssid的聚类方法、装置、设备及介质。
背景技术:
1、目前,在较大的区域使用无线网络时,例如,酒店、大学校园、企业办公场所等,为了使区域内都具有较好的信号与网速,通常会布置多个无线接入点,例如使用一个多ssid功能的无线路由分别为企业的每个部门设置无线接入点,用户可以连接不同的无线局域网,具有较好的网速且能避免相互之间的干扰,但在该区域中还存在有若干个其他无线网络,因此,如何实现对网络的分类以对后续的网络分析和管理是非常重要的。
技术实现思路
1、本发明目的在于,提供一种无线网ssid的聚类方法、装置、设备及介质,能够根据无线网的多源数据信息获取到若干个无线网的层层关联关系,以完成对网络的准确分类,有利于实现网络终端的扩展和对大量网络的分析管理。
2、根据本发明的第一方面,提供了一种无线网ssid的聚类方法,包括以下步骤:
3、获取目标区域内若干个待分类无线网分别对应的目标数据信息,所述目标数据信息包括待分类无线网ssid、待分类无线网对应的设备物理地址和地理位置编码。
4、基于预设分类规则,将若干个待分类无线网的目标数据信息划分为若干个目标数据信息集;所述预设分类规则是基于待分类无线网ssid建立的。
5、针对每一目标数据信息集,计算目标数据信息集内任两个目标数据信息对应的目标相似度,并基于若干个目标相似度将所述目标数据信息集划分为若干个中间数据信息集。
6、从每一中间数据信息集中均确定出关键数据信息。
7、获取每一关键数据信息对应的网关,并将不同的目标数据信息集之间对应网关相同的中间数据信息集中的若干个待分类无线网ssid进行聚类。
8、进一步的,所述基于预设分类规则,将若干个待分类无线网的目标数据信息划分为若干个目标数据信息集,包括以下步骤:
9、根据若干个待分类无线网ssid的字符类别以及预设字符类别优先级,将若干个待分类无线网ssid划分为中英文ssid集、数字ssid集和其他ssid集。
10、获取中英文ssid集、数字ssid集和其他ssid集分别对应的若干个目标数据信息。
11、将同一ssid集对应的若干个目标数据信息合并为目标数据信息集,以实现将若干个待分类无线网的目标数据信息划分为若干个目标数据信息集。
12、进一步的,所述针对每一目标数据信息集,计算目标数据信息集内任两个目标数据信息对应的目标相似度,并基于若干个目标相似度将所述目标数据信息集划分为若干个中间数据信息集,包括以下步骤:
13、针对中英文ssid集对应的目标数据信息集,计算目标数据信息集内每两个中英文ssid的第一相似度。
14、当存在第一相似度大于第一预设相似度阈值时,将对应第一相似度大于第一预设相似度阈值的两个目标数据信息确定为关联状态。
15、从所述中英文ssid集对应的目标数据信息集中分别查找出包含有中文字符的中英文ssid并确定为目标ssid。
16、判断每两个目标ssid的前第一预设数量个中文字符是否相同;若相同,将前第一预设数量个中文字符相同的两个目标ssid对应的目标数据信息确定为关联状态,否则确定为非关联状态。
17、根据若干个目标数据信息的关联状态,将中英文ssid集对应的目标数据信息集划分为若干个中间数据信息集。
18、进一步的,所述针对每一目标数据信息集,计算目标数据信息集内任两个目标数据信息对应的目标相似度,并基于若干个目标相似度将所述目标数据信息集划分为若干个中间数据信息集,包括以下步骤:
19、针对数字ssid集对应的目标数据信息集,从目标数据信息集中的每一目标数据信息的设备物理地址和地理位置编码中分别提取前第二预设数量和前第三预设数量个字符,合并作为第一字符串。
20、计算每两个第一字符串的第二相似度。
21、当存在第二相似度大于第二预设相似度阈值时,将对应第二相似度大于第二预设相似度阈值的两个目标数据信息确定为关联状态。
22、根据若干个目标数据信息的关联状态,将数字ssid集对应的目标数据信息集划分为若干个中间数据信息集。
23、进一步的,所述针对每一目标数据信息集,计算目标数据信息集内任两个目标数据信息对应的目标相似度,并基于若干个目标相似度将所述目标数据信息集划分为若干个中间数据信息集,包括以下步骤:
24、针对其他ssid集对应的目标数据信息集,从目标数据信息集中的每一目标数据信息的设备物理地址和地理位置编码中分别提取前第四预设数量和前第三预设数量个字符,合并作为第二字符串。
25、计算每两个第二字符串的第三相似度。
26、当存在第三相似度大于第三预设相似度阈值时,将对应第三相似度大于第三预设相似度阈值的两个目标数据信息确定为关联状态。
27、根据若干个目标数据信息的关联状态,将其他ssid集对应的目标数据信息集划分为若干个中间数据信息集。
28、进一步的,所述从每一中间数据信息集中均确定出关键数据信息,包括以下步骤:
29、获取每一中间数据信息集中每一中间数据信息关联的中间数据信息的数量,以获取到每一中间数据信息集对应的最大数量。
30、将每一中间数据信息集对应的最大数量所对应的中间数据信息确定为关键数据信息。
31、根据本发明的第二方面,提供了一种无线网ssid的聚类装置,所述装置包括:
32、第一获取模块,用于获取目标区域内若干个待分类无线网分别对应的目标数据信息,所述目标数据信息包括待分类无线网ssid、待分类无线网对应的设备物理地址和地理位置编码。
33、第一分类模块,用于基于预设分类规则,将若干个待分类无线网的目标数据信息划分为若干个目标数据信息集;所述预设分类规则是基于待分类无线网ssid建立的。
34、第二分类模块,用于针对每一目标数据信息集,计算目标数据信息集内任两个目标数据信息对应的目标相似度,并基于若干个目标相似度将所述目标数据信息集划分为若干个中间数据信息集。
35、第一确定模块,用于从每一中间数据信息集中均确定出关键数据信息。
36、聚类模块,用于获取每一关键数据信息对应的网关,并将不同的目标数据信息集之间对应网关相同的中间数据信息集中的若干个待分类无线网ssid进行聚类。
37、进一步的,所述第一分类模块包括:
38、第三分类模块,用于根据若干个待分类无线网ssid的字符类别以及预设字符类别优先级,将若干个待分类无线网ssid划分为中英文ssid集、数字ssid集和其他ssid集。
39、第二获取模块,用于获取中英文ssid集、数字ssid集和其他ssid集分别对应的若干个目标数据信息。
40、第一合并模块,用于将同一ssid集对应的若干个目标数据信息合并为目标数据信息集,以实现将若干个待分类无线网的目标数据信息划分为若干个目标数据信息集。
41、进一步的,所述第二分类模块包括:
42、第一计算模块,用于针对中英文ssid集对应的目标数据信息集,计算目标数据信息集内每两个中英文ssid的第一相似度。
43、第二确定模块,用于当存在第一相似度大于第一预设相似度阈值时,将对应第一相似度大于第一预设相似度阈值的两个目标数据信息确定为关联状态;
44、查找模块,用于从所述中英文ssid集对应的目标数据信息集中分别查找出包含有中文字符的中英文ssid并确定为目标ssid。
45、判断模块,用于判断每两个目标ssid的前第一预设数量个中文字符是否相同;若相同,将前第一预设数量个中文字符相同的两个目标ssid对应的目标数据信息确定为关联状态,否则确定为非关联状态。
46、第四分类模块,用于根据若干个目标数据信息的关联状态,将中英文ssid集对应的目标数据信息集划分为若干个中间数据信息集。
47、进一步的,所述第二分类模块包括:
48、第二合并模块,用于针对数字ssid集对应的目标数据信息集,从目标数据信息集中的每一目标数据信息的设备物理地址和地理位置编码中分别提取前第二预设数量和前第三预设数量个字符,合并作为第一字符串。
49、第二计算模块,用于计算每两个第一字符串的第二相似度。
50、第三确定模块,用于当存在第二相似度大于第二预设相似度阈值时,将对应第二相似度大于第二预设相似度阈值的两个目标数据信息确定为关联状态。
51、第五分类模块,用于根据若干个目标数据信息的关联状态,将数字ssid集对应的目标数据信息集划分为若干个中间数据信息集。
52、进一步的,所述第二分类模块包括:
53、第三合并模块,用于针对其他ssid集对应的目标数据信息集,从目标数据信息集中的每一目标数据信息的设备物理地址和地理位置编码中分别提取前第四预设数量和前第三预设数量个字符,合并作为第二字符串。
54、第三计算模块,用于计算每两个第二字符串的第三相似度。
55、第四确定模块,用于当存在第三相似度大于第三预设相似度阈值时,将对应第三相似度大于第三预设相似度阈值的两个目标数据信息确定为关联状态。
56、第六分类模块,用于根据若干个目标数据信息的关联状态,将其他ssid集对应的目标数据信息集划分为若干个中间数据信息集。
57、进一步的,所述第一确定模块包括:
58、第三获取模块,用于获取每一中间数据信息集中每一中间数据信息关联的中间数据信息的数量,以获取到每一中间数据信息集对应的最大数量。
59、第五确定模块,用于将每一中间数据信息集对应的最大数量所对应的中间数据信息确定为关键数据信息。
60、根据本发明的第三方面,提供了一种电子设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述的无线网ssid的聚类方法。
61、根据本发明的第四方面,提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述的无线网ssid的聚类方法。
62、本发明与现有技术相比至少具有以下有益效果:
63、本发明首先获取目标区域内若干个待分类无线网分别对应的目标数据信息,并根据预设分类规则将若干个待分类无线网的目标数据信息划分为若干个目标数据信息集,实现待分类无线网ssid的初步分类,然后计算每一目标数据信息集内任两个目标数据信息对应的目标相似度,并基于若干个目标相似度将所述目标数据信息集划分为若干个中间数据信息集,实现待分类无线网ssid的进一步分类,再从每一中间数据信息集中均确定出关键数据信息,通过获取每一关键数据信息对应的网关,并将不同的目标数据信息集之间对应网关相同的中间数据信息集中的若干个待分类无线网ssid进行聚类,进而实现对待分类无线网的最终聚类,通过上述方式,能够根据无线网的多源数据信息获取到若干个待分类无线网的层层关联关系,以完成对网络的准确分类,有利于实现网络终端的扩展和对大量网络的分析管理。
1.一种无线网ssid的聚类方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的无线网ssid的聚类方法,其特征在于,所述基于预设分类规则,将若干个待分类无线网的目标数据信息划分为若干个目标数据信息集,包括以下步骤:
3.根据权利要求2所述的无线网ssid的聚类方法,其特征在于,所述针对每一目标数据信息集,计算目标数据信息集内任两个目标数据信息对应的目标相似度,并基于若干个目标相似度将所述目标数据信息集划分为若干个中间数据信息集,包括以下步骤:
4.根据权利要求2所述的无线网ssid的聚类方法,其特征在于,所述针对每一目标数据信息集,计算目标数据信息集内任两个目标数据信息对应的目标相似度,并基于若干个目标相似度将所述目标数据信息集划分为若干个中间数据信息集,包括以下步骤:
5.根据权利要求2所述的无线网ssid的聚类方法,其特征在于,所述针对每一目标数据信息集,计算目标数据信息集内任两个目标数据信息对应的目标相似度,并基于若干个目标相似度将所述目标数据信息集划分为若干个中间数据信息集,包括以下步骤:
6.根据权利要求3至5中任一项所述的无线网ssid的聚类方法,其特征在于,所述从每一中间数据信息集中均确定出关键数据信息,包括以下步骤:
7.一种无线网ssid的聚类装置,其特征在于,所述装置包括:
8.根据权利要求7所述的无线网ssid的聚类装置,其特征在于,所述第一分类模块包括:
9.根据权利要求8所述的无线网ssid的聚类装置,其特征在于,所述第二分类模块包括:
10.根据权利要求8所述的无线网ssid的聚类装置,其特征在于,所述第二分类模块包括:
11.根据权利要求8所述的无线网ssid的聚类装置,其特征在于,所述第二分类模块包括:
12.根据权利要求9至11中任一项所述的无线网ssid的聚类装置,其特征在于,所述第一确定模块包括:
13.一种电子设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至6中任意一项所述的无线网ssid的聚类方法。
14.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至6中任意一项所述的无线网ssid的聚类方法。