数据处理方法以及装置
    1.
    发明授权

    公开(公告)号:CN115115031B

    公开(公告)日:2025-03-25

    申请号:CN202210739152.8

    申请日:2022-06-28

    Abstract: 本说明书实施例提供一种数据处理方法以及装置,所述方法包括:确定初始图网络中的初始活跃图节点,将初始活跃图节点标记为筛选网络的当前网络层的目标数据;在初始图网络中,根据初始活跃图节点以及初始活跃图节点的邻居图节点,确定当前网络层的下一网络层的候选活跃图节点,将候选活跃图节点标记为当前网络层的下一网络层的目标数据;将当前网络层的下一网络层作为当前网络层,将候选活跃图节点作为当前网络层的初始活跃图节点,继续执行根据初始活跃图节点以及初始活跃图节点的邻居图节点,确定当前网络层的下一网络层的候选活跃图节点直至当前网络层为筛选网络的最后一层;删除筛选网络的各个网络层的目标数据中的孤立数据得到目标数据集合。

    数据处理方法以及装置
    2.
    发明公开

    公开(公告)号:CN115080241A

    公开(公告)日:2022-09-20

    申请号:CN202210762371.8

    申请日:2022-06-30

    Inventor: 郭志强

    Abstract: 本说明书实施例提供数据处理方法以及装置,其中数据处理方法应用于第一处理端,包括:确定若干个目标对象和目标对象各自对应的多个处理算子,其中,目标对象携带针对多个处理算子的执行序列,每个处理算子对应一个数据队列,处理算子为对目标对象的特征向量进行降维处理的算子;在对目标对象执行任一处理算子的情况下,冻结目标对象,并将目标对象添加至任一处理算子对应的数据队列;从任一数据队列中提取多个目标对象,并将多个目标对象发送至第二处理端,使第二处理端对多个目标对象并发执行任一数据队列对应的处理算子;接收第二处理端反馈的处理结果,根据处理结果解冻多个目标对象。准确集合目标对象,提高对目标对象执行处理算子的效率。

    一种用于分布式图模型的图学习方法及设备

    公开(公告)号:CN114239858B

    公开(公告)日:2022-06-10

    申请号:CN202210174078.X

    申请日:2022-02-25

    Inventor: 郭志强

    Abstract: 本公开涉及用于分布式图模型的图学习方法,包括:针对所述一条或更多条邻边中的每条邻边,响应于其连接的镜像节点和邻居节点的当前层的节点特征值均被更新,根据当前邻边的上一层的边特征值、镜像节点的当前层的节点特征值、以及当前邻居节点的当前层的节点特征值,计算当前邻边的当前层的边特征值,并根据当前邻边的当前层的边特征值和当前邻居节点的当前层的节点特征值,计算当前邻边在镜像节点处的聚合值;以及响应于所述一条或更多条邻边在镜像节点处的聚合值均被计算,计算镜像节点的本地聚合值,并将镜像节点的本地聚合值传输给用于分布式图学习的第二设备,所述第二设备与所述图模型的第二部分相关联,所述第二部分包括镜像节点的主节点。

    用于分布式图学习架构的数据存取方法及装置

    公开(公告)号:CN114217743A

    公开(公告)日:2022-03-22

    申请号:CN202111491705.4

    申请日:2021-09-17

    Inventor: 郭志强

    Abstract: 本说明书的实施例提供用于分布式图学习架构的数据存取方法及装置。在该数据存取方法中,将第一图学习设备处的图节点分组为多个具有优先级的图节点分组,各个图节点分组的优先级基于图节点依赖关系确定,图节点依赖关系用于反映图节点在图学习时相对于镜像节点的依赖性。基于图节点依赖关系,确定各个图节点分组所依赖的镜像节点;并根据图节点分组的优先级,从第一图学习设备的公共缓冲区中为各个图节点分组所依赖的镜像节点分配缓存空间。针对完成缓存空间分配的图节点,向该图节点所依赖的镜像节点的对应图节点所在的第二图学习设备发起数据存取过程;以及将所获取的图节点数据缓存在所分配的缓存空间中。

    用于分布式图学习架构的数据存取方法及装置

    公开(公告)号:CN113568586B

    公开(公告)日:2021-12-17

    申请号:CN202111091203.2

    申请日:2021-09-17

    Inventor: 郭志强

    Abstract: 本说明书的实施例提供用于分布式图学习架构的数据存取方法及装置。在该数据存取方法中,将第一图学习设备处的图节点分组为多个具有优先级的图节点分组,各个图节点分组的优先级基于图节点依赖关系确定,图节点依赖关系用于反映图节点在图学习时相对于镜像节点的依赖性。基于图节点依赖关系,确定各个图节点分组所依赖的镜像节点;并根据图节点分组的优先级,从第一图学习设备的公共缓冲区中为各个图节点分组所依赖的镜像节点分配缓存空间。针对完成缓存空间分配的图节点,向该图节点所依赖的镜像节点的对应图节点所在的第二图学习设备发起数据存取过程;以及将所获取的图节点数据缓存在所分配的缓存空间中。

    数据处理方法以及装置
    6.
    发明授权

    公开(公告)号:CN115080241B

    公开(公告)日:2024-10-15

    申请号:CN202210762371.8

    申请日:2022-06-30

    Inventor: 郭志强

    Abstract: 本说明书实施例提供数据处理方法以及装置,其中数据处理方法应用于第一处理端,包括:确定若干个目标对象和目标对象各自对应的多个处理算子,其中,目标对象携带针对多个处理算子的执行序列,每个处理算子对应一个数据队列,处理算子为对目标对象的特征向量进行降维处理的算子;在对目标对象执行任一处理算子的情况下,冻结目标对象,并将目标对象添加至任一处理算子对应的数据队列;从任一数据队列中提取多个目标对象,并将多个目标对象发送至第二处理端,使第二处理端对多个目标对象并发执行任一数据队列对应的处理算子;接收第二处理端反馈的处理结果,根据处理结果解冻多个目标对象。准确集合目标对象,提高对目标对象执行处理算子的效率。

    分布式图学习方法和装置

    公开(公告)号:CN114817411B

    公开(公告)日:2022-11-01

    申请号:CN202210717263.9

    申请日:2022-06-23

    Inventor: 郭志强

    Abstract: 本说明书实施例提供了一种分布式图学习方法和装置。该方法中,分布式图中包括跨机节点,该跨机节点被映射为第一设备中的拥有特征数据的主节点以及第二设备中的不拥有特征数据的镜像节点;该方法包括:在一个线程中调度镜像节点进行基于特征数据的计算;判断所述镜像节点是否拥有从主节点同步来的特征数据;如果是,则由镜像节点利用接收到的特征数据进行计算;如果否,在该线程中调度其他节点进行基于特征数据的计算,该镜像节点进入睡眠,在该镜像节点拥有从主节点同步来的特征数据之后唤醒该镜像节点。能够提高图学习的效率。

    分布式图学习方法和装置

    公开(公告)号:CN114817411A

    公开(公告)日:2022-07-29

    申请号:CN202210717263.9

    申请日:2022-06-23

    Inventor: 郭志强

    Abstract: 本说明书实施例提供了一种分布式图学习方法和装置。该方法中,分布式图中包括跨机节点,该跨机节点被映射为第一设备中的拥有特征数据的主节点以及第二设备中的不拥有特征数据的镜像节点;该方法包括:在一个线程中调度镜像节点进行基于特征数据的计算;判断所述镜像节点是否拥有从主节点同步来的特征数据;如果是,则由镜像节点利用接收到的特征数据进行计算;如果否,在该线程中调度其他节点进行基于特征数据的计算,该镜像节点进入睡眠,在该镜像节点拥有从主节点同步来的特征数据之后唤醒该镜像节点。能够提高图学习的效率。

    针对分布式图学习的数据融合方法及装置

    公开(公告)号:CN113835899A

    公开(公告)日:2021-12-24

    申请号:CN202111413646.9

    申请日:2021-11-25

    Inventor: 郭志强

    Abstract: 本说明书实施例提供一种针对分布式图学习的数据融合方法及装置,用于通过分布式系统针对图数据的分布式图学习过程,分布式系统的单个设备预先分配有图数据的多个图节点以及相应的节点连接关系,其中,第一设备包括N个图节点以及M个镜像节点,单个镜像节点与N个图节点中的单个图节点互为邻居节点;在针对分布式图学习的数据融合过程中,第一设备一方面通过相互独立的多个镜像融合线程对M个镜像节点分别执行融合操作,并分别将镜像节点的镜像融合向量加入本地聚合数据序列,另一方面利用发送线程依次发送镜像融合向量,以供各个镜像节点的聚合过程互不依赖。这种方式可以提高分布式图学习过程中的数据融合效率。

    用于分布式图学习架构的数据存取方法及装置

    公开(公告)号:CN113568586A

    公开(公告)日:2021-10-29

    申请号:CN202111091203.2

    申请日:2021-09-17

    Inventor: 郭志强

    Abstract: 本说明书的实施例提供用于分布式图学习架构的数据存取方法及装置。在该数据存取方法中,将第一图学习设备处的图节点分组为多个具有优先级的图节点分组,各个图节点分组的优先级基于图节点依赖关系确定,图节点依赖关系用于反映图节点在图学习时相对于镜像节点的依赖性。基于图节点依赖关系,确定各个图节点分组所依赖的镜像节点;并根据图节点分组的优先级,从第一图学习设备的公共缓冲区中为各个图节点分组所依赖的镜像节点分配缓存空间。针对完成缓存空间分配的图节点,向该图节点所依赖的镜像节点的对应图节点所在的第二图学习设备发起数据存取过程;以及将所获取的图节点数据缓存在所分配的缓存空间中。

Patent Agency Ranking