-
公开(公告)号:CN112115289B
公开(公告)日:2023-11-14
申请号:CN202011038681.2
申请日:2020-09-28
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书的实施例公开了一种图数据采样方法和系统。所述方法包括:基于全图数据获取至少一个第一节点的节点特征以及至少一个输出边的特征,确定第一数据记录;输出边的起始点为第一节点、结束点为第二节点;将第一数据记录作为对第一节点进行第一化简操作的输入,确定至少一个第二数据记录;迭代执行第二化简操作直至达到预设迭代次数,并基于迭代数据记录确定采样结果,其中,迭代过程包括:基于上一轮化简操作得到的数据记录,确定第二化简操作的输入数据;其中,第一次执行第二化简操作的输入基于第二数据记录确定;基于输入数据对第一节点执行第二化简操作,确定至少一个迭代数据记录。
-
公开(公告)号:CN111240744B
公开(公告)日:2022-03-22
申请号:CN202010007900.4
申请日:2020-01-03
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例公开了一种提高涉及稀疏矩阵并行计算效率的方法及系统。所述方法包括:获取稀疏矩阵,稀疏矩阵由多个非零值和多个非零值对应的多个坐标组成,坐标表示非零值在稀疏矩阵中的位置;坐标包括行坐标,行坐标表示非零值在稀疏矩阵中的行数;基于多个非零值的个数和计算线程的个数将多个非零值划分为多个第一类数据区;遍历多个第一类数据区,将相邻的两个第一类数据区中位于稀疏矩阵同一行的非零值划分到同一个数据区中,生成多个第二类数据区;将多个第二类数据区分配给多个计算线程;多个计算线程并行执行计算任务。
-
公开(公告)号:CN112115289A
公开(公告)日:2020-12-22
申请号:CN202011038681.2
申请日:2020-09-28
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书的实施例公开了一种图数据采样方法和系统。所述方法包括:基于全图数据获取至少一个第一节点的节点特征以及至少一个输出边的特征,确定第一数据记录;输出边的起始点为第一节点、结束点为第二节点;将第一数据记录作为对第一节点进行第一化简操作的输入,确定至少一个第二数据记录;迭代执行第二化简操作直至达到预设迭代次数,并基于迭代数据记录确定采样结果,其中,迭代过程包括:基于上一轮化简操作得到的数据记录,确定第二化简操作的输入数据;其中,第一次执行第二化简操作的输入基于第二数据记录确定;基于输入数据对第一节点执行第二化简操作,确定至少一个迭代数据记录。
-
公开(公告)号:CN111291869B
公开(公告)日:2020-11-24
申请号:CN202010384216.8
申请日:2020-05-09
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例提供一种并行训练业务模型的方法,在并行训练业务模型的过程中,就参与并行训练的多个设备中的单个设备而言,仅保存一部分模型参数的当前值,在其他设备需要相关模型参数时,实时从该单个设备获取这些参数。在参数调整更新过程中,其他设备将相关模型参数的当前梯度反馈给该单个设备,由该单个设备综合考虑各个当前梯度,对所保存的模型参数进行当前值的调整。由于各个设备分别处理部分模型参数,可以有效缩短计算和通信时间,从而提高模型并行训练效率。
-
公开(公告)号:CN111240744A
公开(公告)日:2020-06-05
申请号:CN202010007900.4
申请日:2020-01-03
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例公开了一种提高涉及稀疏矩阵并行计算效率的方法及系统。所述方法包括:获取稀疏矩阵,稀疏矩阵由多个非零值和多个非零值对应的多个坐标组成,坐标表示非零值在稀疏矩阵中的位置;坐标包括行坐标,行坐标表示非零值在稀疏矩阵中的行数;基于多个非零值的个数和计算线程的个数将多个非零值划分为多个第一类数据区;遍历多个第一类数据区,将相邻的两个第一类数据区中位于稀疏矩阵同一行的非零值划分到同一个数据区中,生成多个第二类数据区;将多个第二类数据区分配给多个计算线程;多个计算线程并行执行计算任务。
-
公开(公告)号:CN111079082A
公开(公告)日:2020-04-28
申请号:CN201911330882.7
申请日:2019-12-20
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F17/16
Abstract: 本说明书实施例公开了一种提高涉及稀疏矩阵计算速率的方法及系统。所述方法包括:获取稀疏矩阵,所述稀疏矩阵由至少一个非零值和所述至少一个非零值对应的坐标组成,所述坐标表示所述非零值在所述稀疏矩阵中的位置;所述坐标包括行坐标,所述行坐标表示所述非零值在所述稀疏矩阵中的行数;遍历所述稀疏矩阵,基于所述非零值对应的行坐标,生成所述至少一个非零值的至少一个访问索引;其中,所述访问索引表示所述非零值在所述至少一个非零值中被访问的顺序,行坐标相同的所述非零值对应的访问索引相邻;基于所述至少一个访问索引,访问所述至少一个非零值,并基于所述至少一个非零值进行矩阵计算。
-
公开(公告)号:CN110705709A
公开(公告)日:2020-01-17
申请号:CN201910975012.9
申请日:2019-10-14
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06N3/08
Abstract: 本说明书实施例提供一种训练图神经网络模型的方法和装置。方法包括:从样本集中获取目标训练样本,及对应的目标样本标签;目标训练样本对应目标关系网络图中的目标节点,目标节点具有目标节点编号,目标关系网络图包括多个节点以及节点之间的连接边,各节点具有各自对应的节点编号,各连接边具有各自对应的边编号;根据目标节点编号和预设参数,从预先存储的目标关系网络图的图信息中,查询目标关系网络图的目标子图的图信息;目标子图以目标节点为中心节点,且目标子图中的各节点与目标节点之间的跳数小于或等于预设参数;利用目标子图的图信息和目标样本标签,对图神经网络模型进行训练。能够降低对机器的要求,并且提高训练效率。
-
公开(公告)号:CN111079082B
公开(公告)日:2023-03-10
申请号:CN201911330882.7
申请日:2019-12-20
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F17/16
Abstract: 本说明书实施例公开了一种提高涉及稀疏矩阵计算速率的方法及系统。所述方法包括:获取稀疏矩阵,所述稀疏矩阵由至少一个非零值和所述至少一个非零值对应的坐标组成,所述坐标表示所述非零值在所述稀疏矩阵中的位置;所述坐标包括行坐标,所述行坐标表示所述非零值在所述稀疏矩阵中的行数;遍历所述稀疏矩阵,基于所述非零值对应的行坐标,生成所述至少一个非零值的至少一个访问索引;其中,所述访问索引表示所述非零值在所述至少一个非零值中被访问的顺序,行坐标相同的所述非零值对应的访问索引相邻;基于所述至少一个访问索引,访问所述至少一个非零值,并基于所述至少一个非零值进行矩阵计算。
-
公开(公告)号:CN111291870A
公开(公告)日:2020-06-16
申请号:CN202010384220.4
申请日:2020-05-09
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例公开了一种图深度学习中高维稀疏特征的处理方法及系统。所述方法包括:获取至少一个样本,并确定图数据中与所述至少一个样本对应的子图;遍历所述子图,从所述子图的节点获取非零特征;从参数机器中获取与所述非零特征对应的映射参数;其中,所述参数机器为模型训练过程中存放模型参数的机器,所述映射参数为将所述非零特征对应的高维向量映射到低维向量时所使用的参数;训练神经网络模型,对所述非零特征对应的映射参数进行优化,得到训练好的神经网络模型。
-
公开(公告)号:CN111291869A
公开(公告)日:2020-06-16
申请号:CN202010384216.8
申请日:2020-05-09
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例提供一种并行训练业务模型的方法,在并行训练业务模型的过程中,就参与并行训练的多个设备中的单个设备而言,仅保存一部分模型参数的当前值,在其他设备需要相关模型参数时,实时从该单个设备获取这些参数。在参数调整更新过程中,其他设备将相关模型参数的当前梯度反馈给该单个设备,由该单个设备综合考虑各个当前梯度,对所保存的模型参数进行当前值的调整。由于各个设备分别处理部分模型参数,可以有效缩短计算和通信时间,从而提高模型并行训练效率。
-
-
-
-
-
-
-
-
-