-
公开(公告)号:CN111694656B
公开(公告)日:2022-08-05
申请号:CN202010322543.0
申请日:2020-04-22
Applicant: 北京大学
Abstract: 本发明公开一种基于多智能体深度强化学习的集群资源调度方法及系统,涉及计算机软件技术领域,生成随机合成的作业序列或者基于云服务提供商公开数据的真实作业序列,从作业序列中提取作业,添加到等待作业队列中并计算预计执行时间,该等待作业队列设置成由多台机器组成的集群共享,每台机器含有待分配的计算资源;根据传统手工设计的启发式调度算法生成调度决策,并利用该调度决策训练、评估和优化基于多智能体深度强化学习的自适应调度算法,据以得到当前所有待调度作业整体的最终调度决策;对于待调度作业,根据最终调度决策指定的目标机器,在目标机器的可用计算资源中扣除作业使用的资源,到达作业预计完成时间后释放,完成调度。
-
公开(公告)号:CN111966484A
公开(公告)日:2020-11-20
申请号:CN202010581407.3
申请日:2020-06-23
Applicant: 北京大学
Abstract: 本发明涉及一种基于深度强化学习的集群资源管理和任务调度方法及系统。该方法将需要运行的任务放置于待调度任务队列;通过资源调度管理智能体依次处理待调度任务队列中的任务,根据集群资源状况和任务的资源需求产生调度决策;所述资源调度管理智能体是根据在集群上运行的历史任务记录,使用深度强化学习的方法训练得到的神经网络;根据调度决策,将任务调度至集群中对应的机器上执行。本发明能够提高集群资源的利用率和系统吞吐率,并使得计算机集群资源分配可以在任务负载情况变化时自适应;本发明能够使得任务的响应时间更短,能够在相同负载的情况下减少集群机器数目,对于节省能源保护环境有重要的意义。
-
公开(公告)号:CN111694656A
公开(公告)日:2020-09-22
申请号:CN202010322543.0
申请日:2020-04-22
Applicant: 北京大学
Abstract: 本发明公开一种基于多智能体深度强化学习的集群资源调度方法及系统,涉及计算机软件技术领域,生成随机合成的作业序列或者基于云服务提供商公开数据的真实作业序列,从作业序列中提取作业,添加到等待作业队列中并计算预计执行时间,该等待作业队列设置成由多台机器组成的集群共享,每台机器含有待分配的计算资源;根据传统手工设计的启发式调度算法生成调度决策,并利用该调度决策训练、评估和优化基于多智能体深度强化学习的自适应调度算法,据以得到当前所有待调度作业整体的最终调度决策;对于待调度作业,根据最终调度决策指定的目标机器,在目标机器的可用计算资源中扣除作业使用的资源,到达作业预计完成时间后释放,完成调度。
-
-