关键词:
工业物联网
数据共享
联邦学习
隐私保护
摘要:
工业物联网在工业数字化进程中发挥着重要作用。通过构建高效的数据共享系统,挖掘工业数据中的潜在知识,优化生产制造流程,这已然成为工业物联网发展的新愿景。近年来,作为一种分布式机器学习训练框架,联邦学习可以在不直接共享用户本地数据的前提下协作训练全局模型,为工业物联网环境下的跨用户数据共享提供了一种可行的解决方案。
然而,面对复杂的工业物联网环境,采用联邦学习进行数据共享仍然面临着很多挑战。首先,工业物联网环境下设备和数据的异构性不仅降低了联邦学习的性能和效率,而且共享同一个全局模型也无法满足不同用户的个性化需求,因此需要个性化的联邦学习算法;其次,在基于联邦学习进行数据共享时,存在隐私泄露的挑战。比如客户端传输的本地模型参数中蕴含大量的隐私信息,恶意者可以从中推断出用户的敏感信息,因此需要增强对用户隐私信息的保护。传统的基于联邦学习的数据共享工作虽然针对上述挑战进行了大量研究,但大都存在各种不足,无法直接应用于工业物联网环境。
针对上述问题,本文对工业物联网环境下支持数据共享的联邦学习方法在应用过程中面临的异构性、个性化需求以及隐私泄露问题展开研究。
(1)针对工业物联网中设备异构的问题,本文提出一种数字孪生赋能的联邦学习架构。通过数字孪生模型实时监控、模拟工业物联网设备的状态,动态调度所有可用设备协作完成本地训练任务,加快全局模型的收敛速度,减轻设备异构性对于联邦学习性能的影响。针对工业物联网中的数据异构性和个性化需求的问题,本文在数字孪生赋能的联邦学习架构的基础上,提出一种基于参数解耦和聚类的个性化联邦学习算法,通过参数解耦方式从全局模型参数中剥离出个性化层,满足用户的个性化需求,并使用聚类方法识别用户之间的关联性,实现相似用户间的深层协作,以此减轻数据异构对于联邦学习效率的影响。最后,本文对提出的联邦学习框架及个性化联邦学习算法进行了理论分析和实验验证,实验结果表明了所提出方案的有效性。
(2)针对基于联邦学习的数据共享过程中隐私泄露的挑战,本文提出一种基于群签名和差分隐私的隐私增强联邦学习方案。首先,本文提出一个基于群签名的客户端匿名及追踪机制,利用群签名技术保护客户端的身份隐私,同时保留追踪恶意参与者身份的权利。其次,为了减少冗余噪声对联邦学习的影响,从用户的角度出发,提出一个基于模糊逻辑的隐私预算转化机制,将用户的隐私保护需求转化为具体的隐私预算值。然后,在此基础上,提出了一个细粒度的差分隐私噪声添加机制,动态调整参数裁剪的阈值,为每个参数计算单独的敏感度,以此减少冗余噪声的添加。最后,对提出方案的安全性和隐私性进行了分析,仿真实验表明所提出的方案的计算和通信成本较低,在相同隐私预算下的性能优于对比方案。