-
公开(公告)号:CN113765949B
公开(公告)日:2024-10-22
申请号:CN202010490013.7
申请日:2020-06-02
Applicant: 华为云计算技术有限公司
IPC: H04L67/1074
Abstract: 本申请提供了一种资源分配的方法以及装置,该方法包括:确定预设时间段内提交的多个作业的特征;根据所述多个作业的特征确定第一影响因子和第二影响因子,其中,所述第一影响因子为集群的历史资源使用信息对应的权重,所述第二影响因子是所述集群的实时资源使用信息对应的权重;根据用户的历史资源使用信息、所述第一影响因子、实时资源使用信息以及所述第二影响因子确定目标用户。本申请的技术方案可以实现资源的公平分配,避免参数设置的不当产生的资源分配不公平的问题。
-
公开(公告)号:CN113849295B
公开(公告)日:2025-05-06
申请号:CN202010600109.4
申请日:2020-06-28
Applicant: 华为云计算技术有限公司
Abstract: 本申请公开了一种模型训练的方法、装置及计算机可读存储介质,属于通信领域。所述方法包括:管理节点调度第一模型训练任务,第一模型训练任务包括第一智能模型和第一参数调整作业的作业标识,第一智能模型是基于第一参数值集合对第一参数调整作业对应的算法进行配置得到的;根据作业标识确定第一计算节点,第一计算节点具有第一训练数据和空闲的第一资源中的至少一个,第一资源是用于处理第一参数调整作业所需的资源,第一训练数据是用于训练第一参数调整作业的智能模型所需的训练数据;向第一计算节点发送第一训练请求,第一训练请求用于第一计算节点根据第一资源和第一训练数据中的至少一个,训练第一智能模型。本申请能够提高模型训练的效率。
-
公开(公告)号:CN113127186B
公开(公告)日:2024-04-26
申请号:CN201911410034.7
申请日:2019-12-31
Applicant: 华为云计算技术有限公司
IPC: G06F9/50
Abstract: 本公开是关于一种配置集群节点资源的方法、装置、服务器和存储介质,属于信息技术领域。所述方法包括:每当到达预设的资源配置周期时,获取集群节点所属的至少两个集群分别对应的资源分配参照信息,其中,资源分配参照信息包括当前闲置资源量;基于资源分配参照信息,确定集群节点所属的每个集群对应的资源分配量;基于资源分配量,对集群节点中的资源进行资源配置处理。采用本公开,可以主动在每个资源配置周期,基于资源分配参照信息动态对集群节点中的资源进行资源配置处理,进而可以实现同一集群节点中资源量的动态分配和平衡。
-
公开(公告)号:CN113037800B
公开(公告)日:2024-03-05
申请号:CN202010407994.4
申请日:2020-05-14
Applicant: 华为云计算技术有限公司
IPC: H04L67/10 , H04L67/1008 , G06F9/50
Abstract: 本申请提供了一种作业调度方法以及作业调度装置,该方法包括:接收目标作业,目标作业包括n个任务;根据目标作业的n个任务在节点集群中分别进行节点筛选,得到n个候选节点集合,每一候选节点集合包括多个候选节点;在n个任务中的第m个任务对应的第m个候选节点集合中选择网络传输性能分数最高的候选节点作为第m个任务的目标节点,第m个任务的目标节点用于处理第m个任务,网络传输性能分数由n个任务在同一机架聚合度、n个任务之间的亲和度、n个任务的跨节点度和节点空闲度中的一者或任意组合决定,n为大于或者等于1整数,m为1至n之间的任意正整数。本申请的技术方案能够缩短目标作业的运行时间,提高目标作业的运行效率。
-
-
-