页面风险内容识别方法、装置、设备及存储介质与流程

xiaoxiao8月前  41


本公开实施例涉及网络信息技术,尤其涉及一种与页面安全相关的页面风险内容识别方法、装置、设备及存储介质。


背景技术:

1、随着互联网应用的普及,用户可以十分便捷的从网络获取信息,导致越来越多的风险内容通过页面展示给用户,使得用户访问网页的行为存在安全隐患。

2、目前,通常对不同url(uniform resource locator,统一资源定位符)指向的页面进行风险检测,屏蔽存在风险的页面对应的url。然而,以url维度进行页面风险检测至少存在风险内容漏放、页面重复检测的问题,影响页面风险内容识别的准确度和页面处置效率。


技术实现思路

1、本公开实施例提供一种页面风险内容识别方法、装置、设备及存储介质,可以改善风险内容漏放、页面重复检测的问题,提升了页面风险内容识别的准确度和页面处置效率。

2、第一方面,本公开实施例提供了一种页面风险内容识别方法,包括:

3、获取客户端发送的页面特征值,其中,所述页面特征值为基于目标应用程序的第一页面的内容信息确定的字符串;

4、比对所述页面特征值与已风险识别页面的页面特征值,其中,所述已风险识别页面为具有风险内容识别结果的页面;

5、根据特征值比对结果确定第二页面,对所述第二页面进行页面风险内容识别,其中,所述第二页面为与所述已风险识别页面不重复的第一页面。

6、第二方面,本公开实施例还提供了一种页面风险内容识别方法,包括:

7、获取目标应用程序的第一页面的代码信息;

8、根据所述代码信息获取内容文本和素材内容,根据所述内容文本和素材内容生成所述第一页面的页面特征值;

9、发送所述页面特征值至服务端,通过所述服务端比对所述页面特征值与已风险识别页面的页面特征值,根据特征值比对结果确定第二页面,对所述第二页面进行页面风险内容识别,其中,所述已风险识别页面为具有风险内容识别结果的页面,所述第二页面为与所述已风险识别页面不重复的第一页面。

10、第三方面,本公开实施例还提供了一种页面风险内容识别装置,该装置包括:

11、特征值获取模块,用于获取客户端发送的页面特征值,其中,所述页面特征值为基于目标应用程序的第一页面的内容信息确定的字符串;

12、特征值比对模块,用于比对所述页面特征值与已风险识别页面的页面特征值,其中,所述已风险识别页面为具有风险内容识别结果的页面;

13、风险识别模块,用于根据特征值比对结果确定第二页面,对所述第二页面进行页面风险内容识别,其中,所述第二页面为与所述已风险识别页面不重复的第一页面。

14、第四方面,本公开实施例还提供了一种页面风险内容识别装置,该装置包括:

15、信息获取模块,用于获取目标应用程序的第一页面的代码信息;

16、特征值生成模块,用于根据所述代码信息获取内容文本和素材内容,根据所述内容文本和素材内容生成所述第一页面的页面特征值;

17、特征值发送模块,用于发送所述页面特征值至服务端,通过所述服务端比对所述页面特征值与已风险识别页面的页面特征值,根据特征值比对结果确定第二页面,对所述第二页面进行页面风险内容识别,其中,所述已风险识别页面为具有风险内容识别结果的页面,所述第二页面为与所述已风险识别页面不重复的第一页面。

18、第五方面,本公开实施例还提供了一种电子设备,所述电子设备包括:

19、一个或多个处理器;

20、存储装置,用于存储一个或多个程序,

21、当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如本公开实施例所述的页面风险内容识别方法。

22、第六方面,本公开实施例还提供了一种包含计算机可执行指令的存储介质,所述计算机可执行指令在由计算机处理器执行时用于执行如本公开实施例所述的页面风险内容识别方法。

23、本公开实施例提供一种页面风险内容识别方法、装置、设备及存储介质,通过比对第一页面的页面特征值与已风险识别页面的页面特征值,根据特征值比对结果确定第一页面中与已风险识别页面不重复的第二页面,对第二页面进行页面风险内容识别,实现从页面内容的维度区分页面,可以避免对页面内容相同的页面进行重复识别,减少风险内容漏放及页面重复检测等情况,提升了页面风险内容识别的准确度和页面处置效率。



技术特征:

1.一种页面风险内容识别方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述比对所述页面特征值与已风险识别页面的页面特征值,包括:

3.根据权利要求2所述的方法,其特征在于,在对所述第二页面进行页面风险内容识别之后,还包括:

4.根据权利要求2所述的方法,其特征在于,在根据所述页面特征值是否存在于预设页面特征值库确定特征值比对结果之后,还包括:

5.根据权利要求1所述的方法,其特征在于,所述根据特征值比对结果确定第二页面,包括:

6.根据权利要求1所述的方法,其特征在于,在获取客户端发送的页面特征值之后,还包括:

7.根据权利要求6所述的方法,其特征在于,所述根据所述页面特征值检测所述第一页面是否为隐私页面,包括:

8.根据权利要求7所述的方法,其特征在于,所述根据所述对应关系确定第一页面是否为隐私页面,包括:

9.一种页面风险内容识别方法,其特征在于,包括:

10.根据权利要求9所述的方法,其特征在于,所述根据所述代码信息获取内容文本和素材内容,根据所述内容文本和素材内容生成所述第一页面的页面特征值,包括:

11.根据权利要求9所述的方法,其特征在于,所述根据所述代码信息获取内容文本和素材内容,根据所述内容文本和素材内容生成所述第一页面的页面特征值,包括:

12.一种页面风险内容识别装置,其特征在于,包括:

13.一种页面风险内容识别装置,其特征在于,包括:

14.一种电子设备,其特征在于,所述电子设备包括:

15.一种包含计算机可执行指令的存储介质,其特征在于,所述计算机可执行指令在由计算机处理器执行时用于执行如权利要求1-11中任一所述的页面风险内容识别方法。


技术总结
本公开实施例提供了一种页面风险内容识别方法、装置、设备及存储介质。该方法包括获取客户端发送的页面特征值,其中,所述页面特征值为基于目标应用程序的第一页面的内容信息确定的字符串;比对所述页面特征值与已风险识别页面的页面特征值,其中,所述已风险识别页面为具有风险内容识别结果的页面;根据特征值比对结果确定第二页面,对所述第二页面进行页面风险内容识别,其中,所述第二页面为与所述已风险识别页面不重复的第一页面。通过本公开实施例实现从页面内容的维度区分页面,可以避免对页面内容相同的页面进行重复识别,减少风险内容漏放及页面重复检测等情况,提升了页面风险内容识别的准确度和页面处置效率。

技术研发人员:宋晨波,黄志均,陈辉华,杜家浩,程翔龙
受保护的技术使用者:北京字跳网络技术有限公司
技术研发日:
技术公布日:2024/9/23

最新回复(0)