本发明涉及人工智能技术与信息安全交叉领域,尤其指一种面向工业互联网数据安全共享的联邦学习认证系统及方法。
背景技术:
1、近年来,物联网设备的使用量不断增加,导致工业环境中的数据收集显著增加。通过使用物联网技术,工业互联网允许使用大数据技术来监控生产环境和控制过程。这有可能极大地改变工业环境与最终用户之间连接和通信方式,使工业生产与先进技术有效融合。
2、工业互联网的部署促进了无缝的数据共享,为企业带来了诸多优势。该框架促进了不同设备、系统和实体之间的跨平台知识交流和协同合作,从而激发了创新并提高了运营效率。来自共享数据的实时数据分析使企业能够加快决策过程,并及时优化运营工作流程。此外,它还有助于优化资源配置、提高设备效率并减少资源浪费。
3、为了解决隐私担忧,联邦学习技术将训练数据保留在本地设备上,减少了数据传输和隐私泄露的风险。然而,联邦学习存在诸如缺乏参与者身份验证等局限性,这可能导致共享无效或恶意模型等问题。
4、在联邦学习生态系统中,身份认证对于建立信任和验证参与者的身份至关重要。认证过程是确保数据交换完整性、防止未经授权的访问以及验证网络中模型更新合法性的必要步骤。然而,传统的认证方法可能会引入计算开销、延迟问题和潜在的隐私漏洞。因此,在工业互联网环境中实施联邦学习数据共享的一个关键挑战是确保高效且保护隐私的认证机制,以实现无缝的模型更新和分布式参与者之间的合作,同时保护敏感的工业数据。
技术实现思路
1、本发明的目的之一在于针对上述背景技术中的缺陷,提供一种面向工业互联网数据安全共享的联邦学习认证系统,以解决当下工业互联网数据共享时联邦学习参与者的身份认证问题。
2、为了解决上述技术问题,本发明采用如下技术方案:一种面向工业互联网数据安全共享的联邦学习认证系统,包括:
3、云服务器,用于接收来自参与者的本地模型,并将它们整合成一个全局模型,所述全局模型随后会被分发给所有参与者,用于下一轮的训练;
4、参与者,用于参与数据共享的企业,其利用本地收集的数据训练本地模型并将训练好的模型参数传输到云服务器;
5、ta,用于生成系统的公共参数的可信机构,所述ta为参与者分配伪身份,以确保在交互过程中保持匿名性,并在检测到恶意行为时追踪参与者的真实身份,将其透露给云服务器以撤销其参与联邦学习的资格,所述ta还为参与者和云服务器生成部分公私钥对,但不参与联邦学习过程。
6、本发明还提供一种面向工业互联网数据安全共享的联邦学习认证方法,该方法基于上述的面向工业互联网数据安全共享的联邦学习认证系统,其包括以下步骤:
7、s1、初始化:ta根据系统安全要求选择安全参数,生成相应的参数和哈希函数等;
8、s2、生成伪身份:ta为每个参与者分配伪身份,这些伪身份在联邦学习过程中使用,但如果存在恶意行为,ta可以追踪恶意参与者的身份;
9、s3、注册:所有的联邦学习参与者和云服务器都需要在ta注册,ta为其分配相应的部分公私钥,云服务器或参与者结合随机选择的秘密值生成完整的公私钥;
10、s4、云服务器配置:云服务器初始化tesla广播认证协议参数、生成群密钥;
11、s5、全局模型分发:云服务器将全局模型分发给每个参与者;
12、s6、本地训练模型和模型上传:参与者利用其收集的数据训练本地模型,并对模型进行签名后把本地模型和签名上传到云服务器;
13、s7、模型聚合:云服务器从参与者处收集本地模型并进行签名验证,签名验证后利用fedavg聚合成全局模型;
14、s8、参与成员管理:有新的参与者要加入联邦学习时,云服务器为其分配必要的参数并更新群密钥;如果检测到恶意参与者,云服务器撤销恶意参与者的参数并更新群密钥。
15、优选地,参与者和云服务器注册时,ta选择随机数,生成部分私钥fi和部分公钥fi;参与者和云服务器设置秘密值xi,并结合秘密值和部分公私钥计算得到其公钥pki和私钥ski。
16、更优选地,云服务器预先设置联邦学习训练的轮数e,选择一个随机数,进行e次哈希操作后发送给参与者。
17、更优选地,云服务器通过选择不同的质数,并利用中国剩余定理计算得到群公钥α,参与者执行求模操作得到群密钥kd。
18、更优选地,在i轮,云服务器计算得到本轮的密钥ki,并把本轮的全局模型用ki生成消息认证码,延迟一段时间后再广播密钥ki,接收方利用ki验证消息认证码,得到全局模型。
19、更优选地,参与者选择一个随机数ui,计算ui=ui·p,si=αi·kd,进而计算得到其签名σi=(ui,sngi),其中sngi=ui+hi2·ski+si(mod q),将训练好的本地模型参数和签名发送给云服务器。
20、更优选地,云服务器收到本地模型和签名后要验证签名,可以单次验证或者批量验证。签名验证先验证时间的新鲜性,再验证sngi·p=ui+hi2(li+hi1·ppub)+αi·kpub;批量验证则先分别验证每条消息时间的新鲜性,再验证
21、更优选地,撤销某个成员或者某些成员的群密钥要从μ中撤销其信息,再选择一个新的群密钥k′d,根据更新后的群信息μ′和群密钥k′d得到更新后的α′并广播该消息,群内所有成员收到α′获得新的群密钥k′d。
22、更优选地,某个或者某些企业要参与数据共享,云服务器要把参与者的群密钥加入μ,再选择一个新的群密钥k′d,根据更新后的群信息μ′和群密钥k′d得到更新后的α′并广播该消息,群内所有参与者获得新的群密钥k′d。
23、与现有技术相比,本发明设计了一种高效的无证书认证协议,极大程度提高了认证效率和ta的复杂性;同时采用伪身份,通过混淆模型参数与企业真实身份之间的关联,增强了企业的隐私保护;并利用联邦学习审计机制监督伪造身份和恶意本地模型。该机制可监控匿名通信中的异常行为,准确识别恶意参与者,并采取惩罚措施将其彻底清除出fl系统,防止攻击者不受限制地参与训练。总之,本发明的面向工业互联网数据安全共享的联邦学习认证方法在保证企业数据完整性和安全性的前提下,实现了企业间的数据互通,解决了数据孤岛问题,能够有效促进工业大数据产业协同发展和应用创新。
1.一种面向工业互联网数据安全共享的联邦学习认证系统,其特征在于,包括:
2.一种面向工业互联网数据安全共享的联邦学习认证方法,基于权利要求1所述的面向工业互联网数据安全共享的联邦学习认证系统,其特征在于,包括以下步骤:
3.根据权利要求2所述的面向工业互联网数据安全共享的联邦学习认证方法,其特征在于:参与者和云服务器注册时,ta选择随机数,生成部分私钥fi和部分公钥fi;参与者和云服务器设置秘密值xi,并结合秘密值和部分公私钥计算得到其公钥pki和私钥ski。
4.根据权利要求2所述的面向工业互联网数据安全共享的联邦学习认证方法,其特征在于:云服务器预先设置联邦学习训练的轮数e,选择一个随机数,进行e次哈希操作后发送给参与者。
5.根据权利要求2所述的面向工业互联网数据安全共享的联邦学习认证方法,其特征在于:云服务器通过选择不同的质数,并利用中国剩余定理计算得到群公钥α,参与者执行求模操作得到群密钥kd。
6.根据权利要求2所述的面向工业互联网数据安全共享的联邦学习认证方法,其特征在于:在i轮,云服务器计算得到本轮的密钥ki,并把本轮的全局模型用ki生成消息认证码,延迟一段时间后再广播密钥ki,接收方利用ki验证消息认证码,得到全局模型。
7.根据权利要求2所述的面向工业互联网数据安全共享的联邦学习认证方法,其特征在于:参与者选择一个随机数ui,计算ui=ui·p,si=αi·kd,进而计算得到其签名σi=(ui,sngi),其中sngi=ui+hi2·ski+si(mod q),将训练好的本地模型参数和签名发送给云服务器。
8.根据权利要求2所述的面向工业互联网数据安全共享的联邦学习认证方法,其特征在于:云服务器收到本地模型和签名后要验证签名,可以单次验证或者批量验证。签名验证先验证时间的新鲜性,再验证sngi·p=ui+hi2(li+hi1·ppub)+αi·kpub;批量验证则先分别验证每条消息时间的新鲜性,再验证
9.根据权利要求2所述的面向工业互联网数据安全共享的联邦学习认证方法,其特征在于:撤销某个成员或者某些成员的群密钥要从μ中撤销其信息,再选择一个新的群密钥k′d,根据更新后的群信息μ′和群密钥k′d得到更新后的α′并广播该消息,群内所有成员收到α′获得新的群密钥k′d。
10.根据权利要求2所述的面向工业互联网数据安全共享的联邦学习认证方法,其特征在于:某个或者某些企业要参与数据共享,云服务器要把参与者的群密钥加入μ,再选择一个新的群密钥k′d,根据更新后的群信息μ′和群密钥k′d得到更新后的α′并广播该消息,群内所有参与者获得新的群密钥k′d。
