一种面向神经网络模型计算的图执行方法和装置

    公开(公告)号:CN114237918A

    公开(公告)日:2022-03-25

    申请号:CN202210183223.0

    申请日:2022-02-28

    Abstract: 本发明公开了一种面向神经网络模型计算的图执行方法和装置,包括根据深度学习框架编译生成的物理计算图,创建本机上的任务执行体,通过设计为每个任务执行体分配多个空闲内存块的方案,实现整张计算图以流水并行的方式同时参与到不同批次数据的深度学习训练任务中,本发明公开的面向神经网络模型计算的图执行方法和装置,以算子核函数的执行体为基本单元,以生产和消费的张量作为整个计算图中流动的数据,执行体以流水并行的方式实现模型的训练过程。在大规模深度神经网络的分布式应用场景下,本发明对用户的使用门槛较低,并且能够使模型学习到大量分批次流入神经网络的数据的内在关联,从而获得对应场景中的“智能”感知与判断能力。

    一种服务器集群资源的统一调度方法和装置

    公开(公告)号:CN115952008A

    公开(公告)日:2023-04-11

    申请号:CN202310247734.9

    申请日:2023-03-15

    Abstract: 本发明公开了一种服务器集群资源的统一调度方法和装置,该方法针对服务器资源调度的增量实时调度和全量碎片整理,合并简化了调度方法,实现了方法的复用;该方法包括以下步骤:获取当前时刻服务器集群状态的快照;根据快照,获取集群中的所有在运行的服务器集合,并根据优先级进行降序排列;依次遍历所排序的服务器集合,对每台服务器,通过弹射链和蒙特卡洛树搜索方法,依次判断所部署的容器是否可迁移至其它低优先级的服务器,并执行相应操作。本发明能获得完整的迁移路径和过程态,对服务器集群的资源进行整理,提高了资源的使用率,优化集群性能,降低功耗,助力实现数据中心的低碳节能、绿色环保的追求。

    一种图像处理方法、装置、存储介质及电子设备

    公开(公告)号:CN116452920A

    公开(公告)日:2023-07-18

    申请号:CN202310513641.6

    申请日:2023-05-06

    Abstract: 本说明书公开了一种图像处理方法、装置、存储介质及电子设备,本说明书实施例通过人工智能平台在获取到用户上传的数据之后,对数据进行自动标注,得到标注数据。根据接收到的用户针对模型的训练偏好,确定出待训练模型。基于标注数据和训练参数,对待训练模型进行训练,得到训练后模型,并将训练后模型进行部署,以使用户调用训练后模型执行图像处理任务。在此方法中,通过人工智能平台实现数据的标注、模型的训练以及模型的部署,无需开发人员自己开发模型,另外,基于用户的训练偏好,选择出适合的待训练模型,可以提高人工智能平台的服务质量。

    一种k8s容器云平台中CRD应用集成调用方法与装置

    公开(公告)号:CN115357369B

    公开(公告)日:2023-03-24

    申请号:CN202211290188.9

    申请日:2022-10-21

    Abstract: 本发明公开了一种k8s容器云平台中CRD应用集成调用方法与装置,基于k8s的CRD模块,定义容器应用资源对象,包括控制信息和资源信息;构建其他CRD资源注册机制,注册其他CRD资源信息,并保存对其控制器信息,刷新并读取控制器信息,通过反射的方式运行其他CRD资源的控制器,使得用于运行控制器的最小单元上,能够运行多个其他CRD资源的控制器;将控制器部署到K8s中,用户提交控制信息和已注册的其他CRD资源的资源信息,系统根据控制信息执行控制逻辑,根据资源信息提交相应计算任务到k8s容器云平台中,已注册的其他CRD资源的控制器对计算任务进行处理;从而达到减少了资源的占用的目的。

    一种面向神经网络模型计算的图执行方法和装置

    公开(公告)号:CN114237918B

    公开(公告)日:2022-05-27

    申请号:CN202210183223.0

    申请日:2022-02-28

    Abstract: 本发明公开了一种面向神经网络模型计算的图执行方法和装置,包括根据深度学习框架编译生成的物理计算图,创建本机上的任务执行体,通过设计为每个任务执行体分配多个空闲内存块的方案,实现整张计算图以流水并行的方式同时参与到不同批次数据的深度学习训练任务中,本发明公开的面向神经网络模型计算的图执行方法和装置,以算子核函数的执行体为基本单元,以生产和消费的张量作为整个计算图中流动的数据,执行体以流水并行的方式实现模型的训练过程。在大规模深度神经网络的分布式应用场景下,本发明对用户的使用门槛较低,并且能够使模型学习到大量分批次流入神经网络的数据的内在关联,从而获得对应场景中的“智能”感知与判断能力。

    一种服务器集群资源的统一调度方法和装置

    公开(公告)号:CN115952008B

    公开(公告)日:2023-06-16

    申请号:CN202310247734.9

    申请日:2023-03-15

    Abstract: 本发明公开了一种服务器集群资源的统一调度方法和装置,该方法针对服务器资源调度的增量实时调度和全量碎片整理,合并简化了调度方法,实现了方法的复用;该方法包括以下步骤:获取当前时刻服务器集群状态的快照;根据快照,获取集群中的所有在运行的服务器集合,并根据优先级进行降序排列;依次遍历所排序的服务器集合,对每台服务器,通过弹射链和蒙特卡洛树搜索方法,依次判断所部署的容器是否可迁移至其它低优先级的服务器,并执行相应操作。本发明能获得完整的迁移路径和过程态,对服务器集群的资源进行整理,提高了资源的使用率,优化集群性能,降低功耗,助力实现数据中心的低碳节能、绿色环保的追求。

    一种面向智能计算的分布式异步规约方法和装置

    公开(公告)号:CN116542324B

    公开(公告)日:2023-10-10

    申请号:CN202310821100.X

    申请日:2023-07-06

    Abstract: 本发明提供了一种面向智能计算的分布式异步规约方法和装置,充分利用计计算集群内部的CPU和GPU异构计算资源,GPU只负责梯度计算,将参数更新和梯度规约卸载到CPU上执行。通过全局参数的训练迭代次序更新、全局参数的训练迭代次序同步、全局梯度同步这三个部分完成所有GPU之间的梯度更新和参数计算。有效提升了分布式训练中的通信和计算的并行性,提升了分布式训练的系统效率和性能。

    一种面向智能计算的分布式异步规约方法和装置

    公开(公告)号:CN116542324A

    公开(公告)日:2023-08-04

    申请号:CN202310821100.X

    申请日:2023-07-06

    Abstract: 本发明提供了一种面向智能计算的分布式异步规约方法和装置,充分利用计计算集群内部的CPU和GPU异构计算资源,GPU只负责梯度计算,将参数更新和梯度规约卸载到CPU上执行。通过全局参数的训练迭代次序更新、全局参数的训练迭代次序同步、全局梯度同步这三个部分完成所有GPU之间的梯度更新和参数计算。有效提升了分布式训练中的通信和计算的并行性,提升了分布式训练的系统效率和性能。

    一种k8s容器云平台中CRD应用集成调用方法与装置

    公开(公告)号:CN115357369A

    公开(公告)日:2022-11-18

    申请号:CN202211290188.9

    申请日:2022-10-21

    Abstract: 本发明公开了一种k8s容器云平台中CRD应用集成调用方法与装置,基于k8s的CRD模块,定义容器应用资源对象,包括控制信息和资源信息;构建其他CRD资源注册机制,注册其他CRD资源信息,并保存对其控制器信息,刷新并读取控制器信息,通过反射的方式运行其他CRD资源的控制器,使得用于运行控制器的最小单元上,能够运行多个其他CRD资源的控制器;将控制器部署到K8s中,用户提交控制信息和已注册的其他CRD资源的资源信息,系统根据控制信息执行控制逻辑,根据资源信息提交相应计算任务到k8s容器云平台中,已注册的其他CRD资源的控制器对计算任务进行处理;从而达到减少了资源的占用的目的。

Patent Agency Ranking