关键词:
联邦学习
差分隐私
信息熵
数据分布
个性化差分隐私
摘要:
联邦学习的模型参数可能导致用户隐私信息泄露,为解决此问题,将联邦学习和差分隐私进行结合的方法被广泛使用,但目前大多数方法只关注统一的隐私预算分配,忽略了由于用户数据分布不平衡带来的不同隐私预算需求。针对上述问题,提出一种基于数据分布的个性化差分隐私的联邦学习方法,根据用户间数据分布的差异,提出一种基于信息熵的隐私预算分配方案,依据信息熵为用户分配不同的隐私预算,信息熵越大的用户分配的隐私预算越高,从而量化了用户的隐私需求,实现对用户隐私的个性化保护。实验结果表明,在数据分布不平衡的场景下,相比基于统一的隐私预算分配方法,基于信息熵的隐私预算分配方法的模型准确率在不同的隐私预算下均有提高。