集群中NodeManager状态管理方法、装置及计算设备

    公开(公告)号:CN111930493B

    公开(公告)日:2023-08-01

    申请号:CN201910394996.1

    申请日:2019-05-13

    Inventor: 李瑶 许佳

    Abstract: 本发明实施例涉及分布式资源管理及调度系统技术领域,公开了一种集群中NodeManager状态管理方法、装置及计算设备。该方法包括:搜集集群的网络负载信息,根据所述网络负载信息对所述集群的硬件状态进行评估;根据评估的结果确定所述集群中节点的健康状态;当所述节点的状态不健康时对NodeManager进行下线操作。通过上述方式,本发明实施例实现了NodeManager故障前预判和自动下线,保障了系统的稳定运行,同时避免了节点主机有多个应用程序抢占时所造成Container分配失败进而导致任务失败的情况。

    集群中NodeManager状态管理方法、装置及计算设备

    公开(公告)号:CN111930493A

    公开(公告)日:2020-11-13

    申请号:CN201910394996.1

    申请日:2019-05-13

    Inventor: 李瑶 许佳

    Abstract: 本发明实施例涉及分布式资源管理及调度系统技术领域,公开了一种集群中NodeManager状态管理方法、装置及计算设备。该方法包括:搜集集群的网络负载信息,根据所述网络负载信息对所述集群的硬件状态进行评估;根据评估的结果确定所述集群中节点的健康状态;当所述节点的状态不健康时对NodeManager进行下线操作。通过上述方式,本发明实施例实现了NodeManager故障前预判和自动下线,保障了系统的稳定运行,同时避免了节点主机有多个应用程序抢占时所造成Container分配失败进而导致任务失败的情况。

Patent Agency Ranking