使用分布式图计算框架进行基于图模型的计算方法及装置

    公开(公告)号:CN117910504A

    公开(公告)日:2024-04-19

    申请号:CN202311785196.5

    申请日:2023-12-22

    Abstract: 本说明书实施例提供一种使用分布式图计算框架进行基于图模型的计算方法及装置,在计算方法中,加载预先针对分布式图计算框架而定义的接口函数库,其中至少定义,特征读取函数以及多个特征处理函数。执行调用特征读取函数的第一语句,该第一语句包括目标点和/或目标边的特征数据的相关参数,从而从分布式图计算框架的外存读取特征数据。执行调用目标特征处理函数的第二语句,该目标特征处理函数选自多个特征处理函数,第二语句包括目标特征处理函数的自定义运算函数和输入特征,该自定义运算函数和输入特征根据目标子模型而确定,该目标子模型是预先根据处理的特征类别对图模型进行拆分得到的多个子模型之一。

    针对图数据的子图采样方法及装置

    公开(公告)号:CN117851644A

    公开(公告)日:2024-04-09

    申请号:CN202410036633.1

    申请日:2024-01-09

    Inventor: 金跃 刘永超

    Abstract: 本说明书实施例提供一种针对图数据的子图采样方法及装置,在进行子图采样过程中,以连接边为线索,以业务需求中的种子节点为中心,向周围扩散采样,并且采样得到的连接边通过种子节点的节点标识记录,从而可以大大提高采样效率。

    自然语言处理模型、预测模型的训练方法及装置

    公开(公告)号:CN117764198A

    公开(公告)日:2024-03-26

    申请号:CN202311647790.8

    申请日:2023-12-04

    Abstract: 本说明书实施例披露一种自然语言处理模型的训练方法及装置、预测模型的训练方法及装置。其中自然语言处理模型的训练方法所涉及多轮次迭代训练中的任一轮次包括:首先,基于本轮使用的一批次自然语言样本,确定所述自然语言处理模型在本轮训练中的本轮梯度数据;接着,基于所述本轮梯度数据,以及在上一轮训练中的上一轮梯度数据,确定梯度差异数据,并根据所述梯度差异数据确定预处理矩阵;然后,根据所述预处理矩阵和所述本轮梯度数据,确定参数调整量;之后,利用所述自然语言处理模型的当前模型参数和所述参数调整量,确定本轮更新后的模型参数。如此,可以加快自然语言处理模型的训练收敛速度,提高模型的泛化性能。

    数据处理方法以及装置
    54.
    发明公开

    公开(公告)号:CN115115031A

    公开(公告)日:2022-09-27

    申请号:CN202210739152.8

    申请日:2022-06-28

    Abstract: 本说明书实施例提供一种数据处理方法以及装置,所述方法包括:确定初始图网络中的初始活跃图节点,将初始活跃图节点标记为筛选网络的当前网络层的目标数据;在初始图网络中,根据初始活跃图节点以及初始活跃图节点的邻居图节点,确定当前网络层的下一网络层的候选活跃图节点,将候选活跃图节点标记为当前网络层的下一网络层的目标数据;将当前网络层的下一网络层作为当前网络层,将候选活跃图节点作为当前网络层的初始活跃图节点,继续执行根据初始活跃图节点以及初始活跃图节点的邻居图节点,确定当前网络层的下一网络层的候选活跃图节点直至当前网络层为筛选网络的最后一层;删除筛选网络的各个网络层的目标数据中的孤立数据得到目标数据集合。

    一种有向图对应的图神经网络的训练方法及装置

    公开(公告)号:CN114462600A

    公开(公告)日:2022-05-10

    申请号:CN202210372957.3

    申请日:2022-04-11

    Inventor: 张国威 刘永超

    Abstract: 本说明书实施例提供一种有向图对应的图神经网络的训练方法及装置,方法包括:控制设备获得用户针对图神经网络在正向推理计算中用于进行节点表征聚合的第一算子设置的聚合配置信息后,提供给工作设备,聚合配置信息包括节点表征聚合涉及的参与对象和第一边方向;工作设备中的任一第一设备针对有向图中其持有的局部图中的当前节点,基于聚合配置信息利用第一算子对当前节点进行表征聚合;基于用于进行反向梯度计算的第二算子及根据聚合配置信息确定的梯度来源信息,确定图神经网络的当前梯度,将其发送至控制设备;控制设备基于各工作设备发送的当前梯度,更新图神经网络的模型参数。

    图数据加载方法及装置
    56.
    发明授权

    公开(公告)号:CN113688068B

    公开(公告)日:2022-02-15

    申请号:CN202111240147.4

    申请日:2021-10-25

    Abstract: 本说明书的实施例提供图数据加载方法及装置。在该图数据加载方法中,响应于从外部获取到待加载图数据,为待加载图数据获取锁。基于图数据加载装置中存储的前一加载图数据的图数据加载标识,确定待加载图数据的图数据加载标识。基于待加载图数据的图数据加载标识,确定出待加载图数据在图数据处理设备的本地内存中所创建的图数据存储空间中的对应存储位置。在释放为待加载图数据获取的锁后,将待加载图数据保存到图数据存储空间中的对应存储位置。

    数据处理方法及装置
    57.
    发明授权

    公开(公告)号:CN112099959B

    公开(公告)日:2021-03-02

    申请号:CN202011310504.5

    申请日:2020-11-20

    Abstract: 本说明书实施例提供一种数据处理方法及装置,在数据处理方法中,获取待处理的目标数组,其中包括第一数目个元素。构建基于第一数目所确定大小的、多个维度的策略空间。该多个维度至少包括,与用于处理目标数组的并行计算单元数相对应的第一维度。在策略空间中,搜索处理目标数组所需时间最短的目标点。将目标点的第一维度的取值作为目标数目,并根据目标数目,对目标数组进行切分。通过调用目标数目个并行计算单元,对切分后的目标数组进行并行处理。

    深度学习模型的更新方法及装置

    公开(公告)号:CN112329941A

    公开(公告)日:2021-02-05

    申请号:CN202011217898.X

    申请日:2020-11-04

    Abstract: 本说明书实施例中提供了一种深度学习模型的更新方法及装置。该方法包括对深度学习模型进行多轮更新。在进行任意一轮更新时,可以首先确定第一内存区域,深度学习模型的N个权重参数对应的当前参数值,在第一内存区域中按照第一参数顺序依次连续存储。接着确定N个权重参数在本轮更新中各自对应的梯度值,以及确定第二内存区域。然后按照第一参数顺序,向第二内存区域依次连续写入N个权重参数各自对应的梯度值。最后通过读取N个当前参数值和N个梯度值,计算N个权重参数各自对应的目标值,利用N个目标值分别对应更新N个当前参数值,N个当前参数值通过同一逻辑算子从第一内存区域中读取,N个梯度值通过同一逻辑算子从第二内存区域中读取。

    一种基于可信执行环境的模型训练方法和装置

    公开(公告)号:CN111935179B

    公开(公告)日:2021-01-12

    申请号:CN202011012420.3

    申请日:2020-09-23

    Abstract: 本说明书披露一种基于可信执行环境的模型训练方法和装置。在一个实施例中,该方法,包括:从加密训练样本集中获取若干加密目标样本;将所述若干加密目标样本输入可信执行环境,在可信执行环境中对所述加密目标样本解密并将解密后的目标样本输入特征提取模型,得到样本特征;将所述可信执行环境输出的样本特征确定为用于本次迭代的目标样本特征;利用所述目标样本特征对目标模型进行本次迭代训练。

Patent Agency Ranking