一种计算系统中的进程监控方法及相关设备

    公开(公告)号:CN115878432A

    公开(公告)日:2023-03-31

    申请号:CN202310122995.8

    申请日:2023-02-16

    Abstract: 本说明书提供了一种计算系统中的进程监控方法及相关设备。该计算系统包括多个计算设备,多个计算设备中的至少部分计算设备用于执行目标计算任务;至少部分计算设备上运行与目标计算任务对应的至少一个计算进程,并且,至少部分计算设备上部署了与至少一个计算进程绑定的代理程序。该方法应用于至少部分计算设备中的目标计算设备上部署的代理程序。该方法包括:从目标计算设备运行的至少一个计算进程中确定待监控的目标进程;获取目标进程在目标时长范围内对应的CPU利用率,并获取目标计算设备在目标时长范围内的总能耗;基于目标进程在目标时长范围内对应的CPU利用率和总能耗,获取目标计算设备在目标时长范围内运行目标进程产生的能耗。

    分布式模型训练的能耗评估方法和装置

    公开(公告)号:CN116302802A

    公开(公告)日:2023-06-23

    申请号:CN202310164804.4

    申请日:2023-02-13

    Abstract: 本说明书实施例提供一种分布式模型训练的能耗评估方法和装置,所述方法由分布式系统执行,所述分布式系统包括多个机器,各机器上部署有单机能耗采集工具;所述方法包括:确定所述多个机器中参与训练目标模型的多个目标机器;获取各个目标机器每隔第一预设时间周期分别上报的、所述单机能耗采集工具采集的目标单机能耗;根据各个目标单机能耗,计算所述目标模型的模型训练在第一时间窗口内的整体能耗。能够满足能耗评估的准确性需求。

    一种计算系统中的进程监控方法及相关设备

    公开(公告)号:CN115878432B

    公开(公告)日:2023-05-12

    申请号:CN202310122995.8

    申请日:2023-02-16

    Abstract: 本说明书提供了一种计算系统中的进程监控方法及相关设备。该计算系统包括多个计算设备,多个计算设备中的至少部分计算设备用于执行目标计算任务;至少部分计算设备上运行与目标计算任务对应的至少一个计算进程,并且,至少部分计算设备上部署了与至少一个计算进程绑定的代理程序。该方法应用于至少部分计算设备中的目标计算设备上部署的代理程序。该方法包括:从目标计算设备运行的至少一个计算进程中确定待监控的目标进程;获取目标进程在目标时长范围内对应的CPU利用率,并获取目标计算设备在目标时长范围内的总能耗;基于目标进程在目标时长范围内对应的CPU利用率和总能耗,获取目标计算设备在目标时长范围内运行目标进程产生的能耗。

Patent Agency Ranking