针对分割学习数据推断攻击的防御方法、电子设备、介质

xiaoxiao9月前  61


本发明属于网络安全领域,尤其涉及一种针对分割学习数据推断攻击的防御方法、电子设备、介质。


背景技术:

1、目前分割学习协议存在不安全性,所提出的标签泄露攻击和数据推断攻击等会泄露参与者的隐私数据,尤其后者可以重建客户端的输入训练数据集,不管对标签在客户端还是服务器端的分割学习框架都具有很大的威胁。

2、然而,对于目前的攻击手段而言尚未有通用的防御方法,常见的隐私保护方法如差分隐私、梯度裁剪、模型修剪、同态加密等有些可以提供一定的隐私性,但是面对多样化的攻击方法仍然无法很好地保护参与方隐私,或是无法平衡防御能力和模型训练准确率。

3、因此,亟需提出一种防御方法以克服上述问题。


技术实现思路

1、针对现有技术不足,本发明提供了一种针对分割学习数据推断攻击的防御方法、电子设备、介质。

2、第一方面,本发明实施例提供了一种针对分割学习数据推断攻击的防御方法,应用于客户端,所述方法包括以下步骤:

3、获取隐私训练数据,随机生成c类数据,将每类数据打乱插入到隐私训练数据中作为客户端的训练数据集;

4、将训练数据集输入至客户端模型中,输出得到中间特征;

5、接收服务器模型下发的激活梯度;其中,所述激活梯度为服务器模型基于中间特征及对应的标签计算得到的损失值,根据损失值在服务器模型上进行后向传播更新服务器模型,输出激活梯度;

6、基于激活梯度更新客户端模型;使得攻击者端将中间特征并输入至训练好的辅助模型h,输出扭曲目标特征空间z;扭曲目标特征空间z输入至训练好的解码器g-1,无法得到反演重建结果,从而完成防御。

7、第二方面,本发明实施例提供了一种针对分割学习数据推断攻击的防御系统,所述系统包括:

8、客户端,用于获取隐私训练数据,随机生成c类数据,将每类数据打乱插入到隐私训练数据中作为客户端的训练数据集;将训练数据集输入至客户端模型中,输出得到中间特征;接收服务器模型下发的激活梯度;基于激活梯度更新客户端模型;从而使得攻击者端获取客户端模型输出的中间特征并输入至训练好的辅助模型h,输出扭曲目标特征空间z;将扭曲目标特征空间z输入至训练好的解码器g-1,无法得到反演重建结果;

9、服务器端,用于基于中间特征及对应的标签计算得到的损失值,根据损失值在服务器模型上进行后向传播更新服务器模型,输出激活梯度。

10、第三方面,本发明实施例提供了一种电子设备,包括存储器和处理器,所述存储器与所述处理器耦接;其中,所述存储器用于存储程序数据,所述处理器用于执行所述程序数据以实现上述的针对分割学习数据推断攻击的防御方法。

11、第四方面,本发明实施例提供了一种计算机可读存储介质,其上存储有计算机程序,所述程序被处理器执行时实现上述的针对分割学习数据推断攻击的防御方法。

12、第五方面,本发明实施例提供了一种计算机程序产品,包括计算机程序/指令,该计算机程序/指令被处理器执行时上述的针对分割学习数据推断攻击的防御方法。

13、与现有技术相比,本发明的有益效果为:

14、本发明提供了一种针对分割学习数据推断攻击的防御方法,通过获取隐私训练数据,随机生成c类数据,将每类数据打乱插入到隐私训练数据中作为客户端的训练数据集;使攻击者的数据集和客户端的数据集的输入域的类别和范围区分开,使客户端的特征不容易被模仿和提取,从而完成防御。



技术特征:

1.一种针对分割学习数据推断攻击的防御方法,其特征在于,应用于客户端,所述方法包括以下步骤:

2.根据权利要求1所述的一种针对分割学习数据推断攻击的防御方法,其特征在于,随机生成c类数据的过程为:

3.根据权利要求1所述的一种针对分割学习数据推断攻击的防御方法,其特征在于,接收服务器模型下发的激活梯度包括:

4.根据权利要求1所述的一种针对分割学习数据推断攻击的防御方法,其特征在于,辅助模型h、解码器g-1的训练过程包括:

5.根据权利要求1所述的一种针对分割学习数据推断攻击的防御方法,其特征在于,更新客户端模型的过程还包括:

6.一种针对分割学习数据推断攻击的防御系统,其特征在于,所述系统包括:

7.根据权利要求5所述的一种针对分割学习数据推断攻击的防御系统,其特征在于,所述系统还包括:

8.一种电子设备,包括存储器和处理器,其特征在于,所述存储器与所述处理器耦接;其中,所述存储器用于存储程序数据,所述处理器用于执行所述程序数据以实现上述权利要求1-5任一项所述的针对分割学习数据推断攻击的防御方法。

9.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述程序被处理器执行时实现如权利要求1-5中任一所述的针对分割学习数据推断攻击的防御方法。

10.一种计算机程序产品,包括计算机程序/指令,其特征在于,该计算机程序/指令被处理器执行时实现权利要求1-5中任一所述的针对分割学习数据推断攻击的防御方法。


技术总结
本发明公开了一种针对分割学习数据推断攻击的防御方法、电子设备、介质,应用于客户端,包括:获取隐私训练数据,随机生成C类数据,将每类数据打乱插入到隐私训练数据中作为客户端的训练数据集;将训练数据集输入至客户端模型中,输出得到中间特征;接收服务器模型下发的激活梯度;其中,所述激活梯度为服务器模型基于中间特征及对应的标签计算得到的损失值,根据损失值在服务器模型上进行后向传播更新服务器模型,输出激活梯度;基于激活梯度更新客户端模型;使得攻击者端将中间特征并输入至训练好的辅助模型h,输出扭曲目标特征空间Z;扭曲目标特征空间Z输入至训练好的解码器g‑1,无法得到反演重建结果,从而完成防御。

技术研发人员:陈珂,吴雨,张帅,谢钟乐,寿黎但
受保护的技术使用者:浙江大学
技术研发日:
技术公布日:2024/9/23

最新回复(0)