保护数据隐私的两方联合训练预测模型的方法及装置

    公开(公告)号:CN115544580B

    公开(公告)日:2023-04-07

    申请号:CN202211507939.8

    申请日:2022-11-29

    Inventor: 赵闻飙 吴若凡

    Abstract: 本说明书实施例提供一种保护数据隐私的两方联合训练预测模型的方法及装置,其中第一方和第二方对应部署预测模型中的序列表征层和预测层。所述方法应用于第一方,包括:利用序列表征层处理其持有的用户行为序列,其中包括样本用户在T个时刻做出的T个行为,具体地,利用行为表征子层确定T个行为对应的T个行为表征;利用注意力子层确定该T个行为表征对应的T个注意力权重,并用其对T个行为表征进行加权求和,得到原始序列表征;利用加噪子层对该原始序列表征添加基于行为个数T而确定的差分隐私噪声,得到加噪序列表征;从第二方接收其基于该加噪序列表征、其持有的对应用户行为序列的序列标签和预测层而确定的针对序列表征层的训练梯度。

    兼顾隐私保护和公平性的图神经网络的训练方法及装置

    公开(公告)号:CN115545172B

    公开(公告)日:2023-02-07

    申请号:CN202211507949.1

    申请日:2022-11-29

    Inventor: 赵闻飙 吴若凡

    Abstract: 本说明书实施例提供一种兼顾隐私保护和公平性的图神经网络的训练方法及装置,该方法包括:利用图神经网络,对用户关系网络图中N个目标用户对应的节点进行表征聚合,得到N个目标用户的用户表征;至少基于各目标用户的用户表征,采用与目标业务相关的预设损失函数,确定各目标用户对应的预测损失;根据各预测损失,确定各目标用户对应的权重值,使得预测损失越大,所对应目标用户的权重值越大;基于各目标用户的预测损失和权重值,确定总预测损失;以最小化总预测损失为目标,调整图神经网络的参数。

    一种图谱的处理方法、装置及设备

    公开(公告)号:CN115545943A

    公开(公告)日:2022-12-30

    申请号:CN202211230330.0

    申请日:2022-09-30

    Abstract: 本说明书实施例公开了一种图谱的处理方法、装置及设备,该方法包括:获取待处理的目标图谱,所述目标图谱中包括节点和有向边;基于所述目标图谱,获取所述目标图谱中的每个节点的内邻域信息和外邻域信息,以及获取所述目标图谱中的每条有向边的内邻域信息和外邻域信息;基于所述目标图谱中的每个节点的内邻域信息和外邻域信息分别与相应的节点的信息进行聚合处理,得到每个节点的聚合信息,并基于所述目标图谱中的每条有向边的内邻域信息和外邻域信息分别与相应的有向边的信息进行聚合处理,得到每条有向边的聚合信息;基于所述每个节点的聚合信息和所述每条有向边的聚合信息,确定所述目标图谱中是否包括异常的节点和/或有向边。

    一种基于隐私保护的图模型训练方法、装置及设备

    公开(公告)号:CN114818973A

    公开(公告)日:2022-07-29

    申请号:CN202210560176.7

    申请日:2021-07-15

    Inventor: 吴若凡

    Abstract: 本说明书实施例公开了一种基于隐私保护的图模型训练方法、装置及设备,该方法应用于终端设备,包括:获取待构建的第一图表的节点信息,以及第二图表的节点信息和节点连接信息;基于第一图表的节点信息,通过预设的全连接网络构建第一图表,并基于第二图表的节点信息和节点连接信息,通过预设的图网络构建第二图表,基于第一节点的隐向量和第一节点对应的训练标签信息,构建第一样本数据;分别为第一图表中的第二节点和第二图表中的节点生成相应的训练标签信息,基于第二节点和第二图表中的节点的隐向量和生成的训练标签信息,构建第二样本数据;基于第一样本数据和第二样本数据对图模型进行模型训练,并获取对应的梯度信息发送给服务器。

    一种基于隐私保护的图模型训练方法、装置及设备

    公开(公告)号:CN113361658B

    公开(公告)日:2022-06-14

    申请号:CN202110801373.9

    申请日:2021-07-15

    Inventor: 吴若凡

    Abstract: 本说明书实施例公开了一种基于隐私保护的图模型训练方法、装置及设备,该方法应用于终端设备,包括:获取待构建的第一图表的节点信息,以及第二图表的节点信息和节点连接信息;基于第一图表的节点信息,通过预设的全连接网络构建第一图表,并基于第二图表的节点信息和节点连接信息,通过预设的图网络构建第二图表,基于第一节点的隐向量和第一节点对应的训练标签信息,构建第一样本数据;分别为第一图表中的第二节点和第二图表中的节点生成相应的训练标签信息,基于第二节点和第二图表中的节点的隐向量和生成的训练标签信息,构建第二样本数据;基于第一样本数据和第二样本数据对图模型进行模型训练,并获取对应的梯度信息发送给服务器。

    基于差分隐私的联邦学习方法、装置及电子设备

    公开(公告)号:CN112541592B

    公开(公告)日:2022-05-17

    申请号:CN202011409580.1

    申请日:2020-12-06

    Inventor: 熊涛 吴若凡 漆远

    Abstract: 本说明书实施例提供一种基于差分隐私的联邦学习方法及装置、电子设备,该方法应用于任一终端设备,包括多次迭代,每次迭代包括:基于训练数据和当前本地参数,确定待处理的第一梯度向量,该第一梯度向量的欧式范数小于等于预设范数,对第一梯度向量进行多级量化处理,得到第二梯度向量,在第二梯度向量的向量空间中,基于第二梯度向量,生成第一向量集合和第二向量集合,进行满足差分隐私的采样,以从第一向量集合或第二向量集合中随机采样出第三梯度向量。对第三梯度向量进行归一化,得到目标梯度向量,并向服务器上传目标梯度向量。能够提高联邦学习过程中的通讯效率,从而提高了联邦学习的效率。

    生成对抗样本的方法及装置

    公开(公告)号:CN113313404A

    公开(公告)日:2021-08-27

    申请号:CN202110662087.9

    申请日:2021-06-15

    Abstract: 本说明书实施例提供一种生成对抗样本的方法和装置,其中方法包括,首先获取目标风险样本的原始样本特征以及风险检测模型。针对该目标风险样本,在预定特征空间中,确定预定数目T个基准方向;依次按照T个基准方向中的不同基准方向,以预设的第一步长,执行若干轮特征变换,直到得到第一变换特征,其中风险检测模型针对该第一变换特征的预测值落入非风险样本对应的预定区间。然后,针对该第一变换特征,沿最后一次特征变换方向的逆向,以依次增大的回退幅度执行若干次回退操作,直到得到第二变换特征,该风险检测模型针对第二变换特征的预测值达到前述预定区间的边界。于是,可以根据该第二变换特征,形成目标风险样本对应的对抗样本。

    图神经网络的训练方法及装置

    公开(公告)号:CN112541575A

    公开(公告)日:2021-03-23

    申请号:CN202011409587.3

    申请日:2020-12-06

    Abstract: 本说明书实施例提供一种图神经网络的训练方法,包括:获取原始关系网络图,其中包括对应多个业务对象的多个对象节点,以及对象节点之间存在关联关系而形成的原始连接边;在该原始关系网络图中添加若干记忆节点,并在每个记忆节点和每个对象节点之间建立新增连接边,得到扩张关系网络图,用于对图神经网络进行多轮迭代更新,其中任一轮包括:利用图神经网络对扩张关系网络图进行图嵌入处理,在多个图神经网络隐层中的任一隐层,对上一隐层针对第一对象节点、其若干邻居对象节点和若干记忆节点输出的隐向量进行聚合,得到本隐层输出的第一对象隐向量;根据最后一个隐层输出的第一对象隐向量以及第一对象节点的业务标签,对图神经网络进行本轮更新。

    估计差分隐私保护数据中分词频度的方法及装置

    公开(公告)号:CN112507710A

    公开(公告)日:2021-03-16

    申请号:CN202110161186.9

    申请日:2021-02-05

    Abstract: 本说明书提供一种估计差分隐私保护数据中分词频度方法、装置及电子设备,根据该方法,获取终端设备上报的、经本地差分隐私处理的各个分词信息;划分出N组分词信息,使同组的各个分词信息对应于相同的目标个数;确定各组分词信息各自对应的表示分词频度无偏估计的各组估计数据;基于所述各组估计数据,逐层生成用于记录分词频度的前缀树的各层节点。其中,在生成前缀树的第n层节点的过程中,选择部分备选n元分词作为第n层节点表示的n元分词,无需遍历由预设的词语单元构成的所有n元分词,不仅大大降低了计算量,提高了计算效率,而且基于分词的频度显著性分布信息而筛选出来的第n层节点表示的n元分词更具合理性。

    隐私保护算法的验证方法、装置及电子设备

    公开(公告)号:CN112016123A

    公开(公告)日:2020-12-01

    申请号:CN202010922588.1

    申请日:2020-09-04

    Inventor: 吴若凡

    Abstract: 本说明书实施例提供一种隐私保护算法的验证方法、装置及电子设备,根据该方法,获取第一隐私仿真数据集、第二隐私仿真数据集以及待验证的隐私保护算法,多次调用上述隐私保护算法处理第一隐私仿真数据集,得到多个第一结果,以及多次调用上述隐私保护算法处理第二隐私仿真数据集,得到多个第二结果。构建多个第一结果的累积分布函数,确定每个第二结果针对上述累积分布函数的p值,得到多个p值,并利用上述多个p值构建权衡函数,以利用该权衡函数的图像验证上述隐私保护算法的隐私保护性能。如此能够便捷且准确地对隐私保护算法的隐私保护性能做出决策。

Patent Agency Ranking