-
公开(公告)号:CN119272142A
公开(公告)日:2025-01-07
申请号:CN202411280837.6
申请日:2024-09-12
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F18/2415 , G06F21/62 , G06N3/0442 , G06N3/098 , G06N20/00 , G06Q40/03
Abstract: 本说明书公开了一种模型训练方法、装置、设备及可读存储介质,第一节点通过部署的第一编码器得到各第一对齐样本的特征以及各第一非对齐样本的特征,针对各第一对齐样本对应的每个标注类别,根据该标注类别包含的各第一对齐样本的特征,确定该标注类别的第一原型向量,针对每个第一非对齐样本,根据该第一非对齐样本的特征与其所属的标注类别的第一原型向量,确定第一损失,并以各第一非对齐样本对应的第一损失训练第一编码器。可见,将各第一非对齐样本引入用于训练第一编码器的样本中,扩大了训练样本的规模,提升了训练完成的第一编码器的准确性,并保障了样本的隐私安全性。
-
公开(公告)号:CN118656491A
公开(公告)日:2024-09-17
申请号:CN202410705697.6
申请日:2024-05-31
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/35 , G06F40/289 , G06N3/0464 , G06N3/08
Abstract: 本说明书实施例提供一种判别模型的训练方法及装置,该判别模型用于判断输入文本是否为大模型的训练集中的成员文本,以对大模型进行隐私安全验证。该训练方法包括:构造目标样本,其中包括,获取N个文本打分对,其中任一文本打分对中的打分利用大模型预测得到。基于查询文本和N个文本打分对构建提示文本,该提示文本指示将N个文本打分对作为上下文,并基于该上下文对查询文本进行打分。将该提示文本输入大模型,得到查询文本对应的目标打分,该目标打分指示该查询文本与上下文的相关性。基于查询文本和目标打分,形成目标样本。基于目标样本,训练判别模型。
-
公开(公告)号:CN118246549A
公开(公告)日:2024-06-25
申请号:CN202410278728.4
申请日:2024-03-11
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例披露一种大模型可解释性的分析方法及装置。该方法包括:首先,通过对范例样本集进行m次采样,获得m个样本子集,其中各个范例样本包括对应用户的用户特征和用户行为标签,所述用户行为标签指示用户是否做出预定行为;接着,针对任意的第一样本子集,将其中各范例样本作为上下文学习的示例,与待预测的目标用户的特征共同输入大模型,得到针对所述目标用户的第一行为预测结果;然后,将所述第一样本子集的采样信息作为样本特征,结合所述第一行为预测结果,构建所述第一样本子集对应的训练样本;之后,利用所述m个样本子集对应的m个训练样本训练目标模型;其中,训练好的目标模型用于所述大模型的可解释性分析。
-
公开(公告)号:CN117932615A
公开(公告)日:2024-04-26
申请号:CN202410077208.7
申请日:2024-01-18
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书公开了一种风险检测方法、装置、存储介质以及电子设备,通过对获取到的明文数据进行脱敏处理,确定出对应的脱敏后数据。然后将脱敏后数据输入到预先经过训练的数据重构模型中,以使得数据重构模型能够根据脱敏后数据,生成出针对明文数据的重构数据。进而根据明文数据和脱敏后数据,以及明文数据对应的重构数据,确定通过脱敏后数据得到明文数据的最小错误率。最后根据最小错误率,对明文数据的脱敏后数据进行风险检测。通过本说明书中的方法能够精准的识别出对原明文数据所对应的脱敏数据是否具有泄露明文数据的风险,有效提高了原明文数据在使用和传输时的安全性,极大程度上维护了原明文数据所属用户或团体的信息安全和数据隐私。
-
公开(公告)号:CN116306991A
公开(公告)日:2023-06-23
申请号:CN202310260591.5
申请日:2023-03-10
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06N20/20
Abstract: 本说明书实施例提供了多种基于联邦学习的数据处理方法、装置及设备,其中一种方法包括:联邦学习客户端基于预先训练的目标模型中的编码器对目标数据的编码结果,确定目标数据对应的编码检测结果,再将目标数据对应的编码检测结果发送给联邦学习服务端,并接收联邦学习服务端发送的目标数据对应的异常检测结果,目标数据对应的异常检测结果为联邦学习服务端基于编码检测结果,以及由预先训练的目标模型中的检测子模型和联邦学习客户端发送的目标数据对应的编码检测结果确定的目标数据与每个预设数据分布的匹配概率,确定的检测结果,联邦学习客户端基于目标数据对应的异常检测结果,确定目标数据是否存在异常。
-
公开(公告)号:CN116090535A
公开(公告)日:2023-05-09
申请号:CN202310095349.7
申请日:2023-01-31
Applicant: 支付宝(杭州)信息技术有限公司
Inventor: 吴若凡
Abstract: 本说明书实施例提供一种图神经网络的训练方法及装置,在图神经网络的训练方法中,获取用户关系网络图。将用户关系网络图分割为多个子图。利用图神经网络分别对各个子图进行图嵌入处理,得到各个用户节点的用户表征。利用预测网络,基于用户表征,得到针对目标业务的预测结果。在目标约束条件下,以最小化代价值为目标,调整图神经网络的第一参数和预测网络的第二参数。其中目标约束条件为,对于每个子图,利用调整后的第二参数得到的子图损失相比于其他第二参数均达到最小,子图损失为,利用预设损失函数对该子图中各个用户节点的预测结果和业务标签计算得到的用户损失之和。上述代价值为,利用调整后的第二参数得到的各个子图的子图损失之和。
-
公开(公告)号:CN115545172A
公开(公告)日:2022-12-30
申请号:CN202211507949.1
申请日:2022-11-29
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例提供一种兼顾隐私保护和公平性的图神经网络的训练方法及装置,该方法包括:利用图神经网络,对用户关系网络图中N个目标用户对应的节点进行表征聚合,得到N个目标用户的用户表征;至少基于各目标用户的用户表征,采用与目标业务相关的预设损失函数,确定各目标用户对应的预测损失;根据各预测损失,确定各目标用户对应的权重值,使得预测损失越大,所对应目标用户的权重值越大;基于各目标用户的预测损失和权重值,确定总预测损失;以最小化总预测损失为目标,调整图神经网络的参数。
-
公开(公告)号:CN115293872A
公开(公告)日:2022-11-04
申请号:CN202210793704.3
申请日:2022-07-07
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06Q40/02 , G06F30/27 , G06K9/62 , G06F119/02
Abstract: 本说明书实施例提供了一种建立风险识别模型的方法及对应装置。其中方法包括:获取利用用户的网络行为数据构建的异构网络图,异构网络图包括节点和边,节点包括行为主体和行为对象,边依据行为主体和行为对象之间的行为关系确定;对异构网络图中的边进行掩膜处理,得到掩膜子图和剩余子图;利用剩余子图和掩膜子图训练图自编码器;其中,图自编码器包括编码网络和第一解码网络;编码网络利用输入的剩余子图得到各节点的表征向量,第一解码网络利用各节点的表征向量预测被掩膜的边,训练目标包括:最小化预测结果与掩膜子图之间的差异;利用训练得到的图自编码器中的编码网络,构建风险识别模型。本申请能够提高风险识别模型的识别效果。
-
公开(公告)号:CN113987280A
公开(公告)日:2022-01-28
申请号:CN202111256452.2
申请日:2021-10-27
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/901 , G06N20/00
Abstract: 本说明书实施例提供一种针对动态图训练图模型的方法及装置,首先获取第一实体对应第一时间点的第一表达向量和第二时间点的第二表达向量,然后通过第一时间表征模型确定第一时间差对应的第一时间表征向量,接着,基于第一时间表征向量确定第一表达向量和第二表达向量之间的f‑信息,进一步以f‑信息最大化为目标确定模型损失,并向着模型损失减小的方向调整图模型及第一时间表征模型中的各个待定参数。这种方式可以提高模型的灵活性和有效性。
-
公开(公告)号:CN113361658A
公开(公告)日:2021-09-07
申请号:CN202110801373.9
申请日:2021-07-15
Applicant: 支付宝(杭州)信息技术有限公司
Inventor: 吴若凡
IPC: G06K9/62 , G06F21/62 , G06F16/901 , G06N3/04 , G06N3/08
Abstract: 本说明书实施例公开了一种基于隐私保护的图模型训练方法、装置及设备,该方法应用于终端设备,包括:获取待构建的第一图表的节点信息,以及第二图表的节点信息和节点连接信息;基于第一图表的节点信息,通过预设的全连接网络构建第一图表,并基于第二图表的节点信息和节点连接信息,通过预设的图网络构建第二图表,基于第一节点的隐向量和第一节点对应的训练标签信息,构建第一样本数据;分别为第一图表中的第二节点和第二图表中的节点生成相应的训练标签信息,基于第二节点和第二图表中的节点的隐向量和生成的训练标签信息,构建第二样本数据;基于第一样本数据和第二样本数据对图模型进行模型训练,并获取对应的梯度信息发送给服务器。
-
-
-
-
-
-
-
-
-