-
公开(公告)号:CN116933863A
公开(公告)日:2023-10-24
申请号:CN202310913276.8
申请日:2023-07-24
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例提供一种分布式模型训练方法和系统,涉及人工智能技术领域。技术要点包括:基于本地的训练样本特征数据以及本地的前端模型,得到中间层数据;对所述中间层数据进行整数化处理,得到整数化数据;将所述整数化数据传输给服务器;接收服务器返回的损失函数值相对所述整数化数据的梯度信息;所述损失函数值反映预测结果以及相应训练样本的标签的差异;基于损失函数值相对所述整数化数据的梯度信息确定损失函数值相对本地的前端模型各模型参数的梯度信息;基于损失函数值相对本地的前端模型各模型参数的梯度信息更新本地的前端模型的模型参数。
-
公开(公告)号:CN116611009A
公开(公告)日:2023-08-18
申请号:CN202310641127.0
申请日:2023-05-31
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F18/2415 , G06N3/098 , G06N3/084 , G06N3/047 , G06N3/0455
Abstract: 本说明书实施例提供一种分类模型的训练方法、用户分类的方法和装置,方法包括:对样本用户的特征表示向量中的元素随机置0处理,得到缺失表示向量;将缺失表示向量输入编码器,得到样本用户对应的隐向量所服从的高斯分布的均值向量和方差向量;基于均值向量和方差向量,生成第一隐向量,将第一隐向量输入解码器,得到样本用户的重建表示向量;根据重建表示向量和特征表示向量之间的差异,确定第一损失项;将均值向量输入分类器,得到样本用户属于各个预设类别的概率分布;根据样本用户的类别标签和概率分布,确定第二损失项;总损失函数包括第一损失项和第二损失项。能够提升分类模型在用户特征取值存在缺失时的性能。
-
公开(公告)号:CN114462600B
公开(公告)日:2022-07-05
申请号:CN202210372957.3
申请日:2022-04-11
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例提供一种有向图对应的图神经网络的训练方法及装置,方法包括:控制设备获得用户针对图神经网络在正向推理计算中用于进行节点表征聚合的第一算子设置的聚合配置信息后,提供给工作设备,聚合配置信息包括节点表征聚合涉及的参与对象和第一边方向;工作设备中的任一第一设备针对有向图中其持有的局部图中的当前节点,基于聚合配置信息利用第一算子对当前节点进行表征聚合;基于用于进行反向梯度计算的第二算子及根据聚合配置信息确定的梯度来源信息,确定图神经网络的当前梯度,将其发送至控制设备;控制设备基于各工作设备发送的当前梯度,更新图神经网络的模型参数。
-
公开(公告)号:CN112329941B
公开(公告)日:2022-04-12
申请号:CN202011217898.X
申请日:2020-11-04
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例中提供了一种深度学习模型的更新方法及装置。该方法包括对深度学习模型进行多轮更新。在进行任意一轮更新时,可以首先确定第一内存区域,深度学习模型的N个权重参数对应的当前参数值,在第一内存区域中按照第一参数顺序依次连续存储。接着确定N个权重参数在本轮更新中各自对应的梯度值,以及确定第二内存区域。然后按照第一参数顺序,向第二内存区域依次连续写入N个权重参数各自对应的梯度值。最后通过读取N个当前参数值和N个梯度值,计算N个权重参数各自对应的目标值,利用N个目标值分别对应更新N个当前参数值,N个当前参数值通过同一逻辑算子从第一内存区域中读取,N个梯度值通过同一逻辑算子从第二内存区域中读取。
-
公开(公告)号:CN113672954A
公开(公告)日:2021-11-19
申请号:CN202110956320.4
申请日:2021-08-19
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例提出了一种特征提取方法、装置和电子设备,其中,上述特征提取方法中,接收模型训练集群发送的数据请求之后,FPGA TEE集群从数据存储服务器上获取预定数量的数据元组,从上述数据元组中解析获得加密的第一密钥,然后与密钥平台进行交互,对上述加密的第一密钥进行解密,获得第一密钥,使用第一密钥对上述数据元组中加密的训练数据进行解密,最后,对解密获得的训练数据进行特征提取,获得上述训练数据对应的特征,将上述特征发送给模型训练集群进行模型训练,从而可以实现在保护数据安全和隐私情况下完成机器学习模型的训练。
-
公开(公告)号:CN119903915A
公开(公告)日:2025-04-29
申请号:CN202411959541.7
申请日:2024-12-27
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06N5/04
Abstract: 本说明书提供了一种基于分布式系统的数据推理方法及相关设备。分布式系统包含多个节点,多个节点各自存储了不同的数据分片。该方法包括:获取多个节点从各自检索出的数据集中选取出的目标数据;任一节点检索出的数据集中包含在该节点存储的数据分片中与用户输入的查询信息相匹配的数据;确定多个目标数据与查询信息之间的匹配度,并从与多个目标数据对应的多个匹配度中确定出匹配度阈值;多个节点检索出的多个数据集中包含的与查询信息之间的匹配度高于匹配度阈值的数据数量,大于或等于预设的筛选数量;获取多个节点从各自的数据集中筛选出的与所述查询信息之间的匹配度高于所述匹配度阈值的推理数据,基于推理数据辅助LLM模型执行推理任务。
-
公开(公告)号:CN119293386A
公开(公告)日:2025-01-10
申请号:CN202411253157.5
申请日:2024-09-06
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书提供了一种矩阵计算方法及相关设备。该方法应用于计算设备,所述计算设备中搭载了外存和内存,所述外存中存储了待计算的第一矩阵,所述内存中存储了待计算的第二矩阵;其中,所述第一矩阵包含的数据量大于所述内存中分配给所述第一矩阵的存储容量。该方法包括:将所述外存中存储的所述第一矩阵划分成多个子矩阵;其中,所述多个子矩阵中的每个子矩阵包含的数据量不大于所述内存中分配给所述第一矩阵的存储容量;将所述多个子矩阵分批次地从所述外存加载至所述内存中,并与所述第二矩阵进行矩阵乘法计算。
-
公开(公告)号:CN119003171A
公开(公告)日:2024-11-22
申请号:CN202411099104.2
申请日:2024-08-09
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F9/50
Abstract: 本说明书一个或多个实施例提供一种资源调度方法、电子设备和介质,所述方法应用于处理器,所述处理器上的计算资源包括:用于并行计算的多个计算单元;其中方法包括:依据稀疏矩阵中的多个调度单元的负载的大小,将多个调度单元排序;所述负载用于表示所述调度单元中包括的非零元素;依据排序结果,将所述稀疏矩阵中包括的多个调度单元,分配至所述多个计算单元,以使得所述计算单元对调度单元中的非零元素进行计算;其中,在依据排序结果分配时,以减小各个计算单元之间的负载差异的方式进行分配。
-
公开(公告)号:CN118917401A
公开(公告)日:2024-11-08
申请号:CN202411081997.8
申请日:2024-08-06
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例提供了一种基于知识图谱训练图编码器的方法及装置。所述知识图谱包括以三元组形式记录的多个节点及其之间的连接边。所述方法包括:根据预设搜索策略,从所述知识图谱中采样节点和连接边,得到若干子图。将第一子图输入所述图编码器,得到第一子图所对应的图表征。基于第二子图中各个三元组所具有的文本语料,确定第一描述文本。将所述第一描述文本输入文本编码器,得到对应的文本表征。基于所述图表征与文本表征之间的表征差异,确定由第一子图和第一描述文本构成的第一样本对的对比损失。根据多个样本对各自的对比损失,更新所述图编码器。
-
公开(公告)号:CN118887005A
公开(公告)日:2024-11-01
申请号:CN202410994960.8
申请日:2024-07-23
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06Q40/03 , G06F18/213 , G06F18/20 , G06N20/00 , G06N5/045
Abstract: 本说明书一个或多个实施例提供一种信贷风险评估方法、装置、设备及存储介质,该方法包括:从图数据的多个节点中,选取待进行评估的目标节点;根据所述目标节点在所述图数据中确定多个子图;通过第一聚合函数将所述子图中第一节点的用户信贷特征聚合到所述子图中的目标节点上,得到聚合特征;从所述聚合特征中选取输入至机器学习模型的目标特征,所述机器学习模型用于预测用户的信贷风险。通过将子图中其他节点的特征聚合到目标节点上,得到具有业务含义的聚合特征,提高了机器学习模型在处理过程中的可解释性;基于图数据提取各个目标特点的聚合特征来进行预测,减少了处理的数据量,也有利于提高机器学习模型处理过程的可解释性。
-
-
-
-
-
-
-
-
-