关键词:
差分隐私
图神经网络
社交网络
图表示学习
摘要:
社交网络是现实世界中沟通交流、信息获取等日常活动的主要平台,其中丰富的信息可以用于挖掘个人的行为模式。图神经网络作为强大的图表示学习工具被广泛用于挖掘丰富的节点属性和拓扑关系,以提高相关下游任务的性能。然而,这些学习结果中通常隐含了大量的个人隐私信息,使得隐私保护成为了社交网络中被重点关注的问题。先进的图表示学习结果给恶意的攻击者提供了数据窃取的新手段,同时也为隐私保护方法的适应性带来了新挑战。(1)隐私保护技术捕捉图数据的异质性难。现实世界图中多节点类型与语义关联性丰富了图神经网络的表达能力,却使传统的隐私保护的方法在异质图上失去了一定的保护能力,例如图表示中隐藏了两个用户之间的关联关系,而攻击者仍可以通过用户的高阶的异质信息与语义(共同行为),推断用户的敏感偏好。(2)隐私保护技术对拓扑层次结构的感知能力弱。层次结构可以更好的帮助模型捕捉实体之间的潜在关联,提高模型推断的性能。然而,它也可能曝光敏感关系(不同层级的联系),更容易被攻击者成功地推断出敏感信息,导致严重的隐私泄露问题。因此,本文围绕社交网络的隐私保护图神经网络学习,提高隐私噪声对数据异质性、拓扑层次性的感知能力。主要研究内容如下:(1)针对图数据异质性中的隐私问题,提出了一种具有语义感知的差分隐私异质图神经网络学习方法HeteSDG。首先,本方法定义了一种具有语义增强的成员推理攻击(MIA-S),可以通过语义分析获得额外背景知识;其次,针对节点高阶邻居的异质性,利用注意力机制和语义去偏机制设计噪声量,提供节点级的个性化隐私保护;针对拓扑结构语义的指导性,通过设计适应异质图数据的差分隐私随机梯度下降策略,为训练梯度施加隐私噪声,并通过引入语义正则作为优化的软目标;最后,为了权衡隐私保护与模型性能,利用双层优化机制为节点级和拓扑级隐私保护提供合理的隐私预算分配。HeteSDG在四个真实数据集上进行了实验,以验证隐私保护能力和泛化性。(2)针对图拓扑层次性中的隐私问题,提出了一种基于双曲几何的、层次感知的差分隐私图神经网络学习方法PoinDP。首先,基于Poincaré模型学习每个实体的层次权重,为随机扰动噪声设计了层次感知的差分隐私敏感度。其次,提出了一种基于高斯机制的层次感知扰动机制,以保护社交网络中的隐私信息。最后,在四个真实数据集上的实验结果表明,PoinDP在节点分类任务上具有全面的优势,并能适应性的针对拓扑层次结构中敏感程度不均衡的信息实施保护。综上所述,本文在社交网络的异质性和层次性上分析了隐私泄露风险,并基于图神经网络学习相应的提出了差分隐私图神经网络学习方法,在社交网络隐私保护的应用中具有启发意义。