机器学习任务的资源管理方法、系统、设备及介质

    公开(公告)号:CN116501491A

    公开(公告)日:2023-07-28

    申请号:CN202310411262.6

    申请日:2023-04-10

    Abstract: 本申请实施例提供了一种机器学习任务的资源管理方法、系统、设备及介质,属于机器学习技术领域。方法包括:获取机器学习中的目标任务;获取目标任务对应的资源弹性伸缩计划策略;根据资源弹性伸缩计划策略确定目标任务执行过程中不同时间段下的资源配置需求,并根据多个资源配置需求生成目标任务执行过程中不同时间段下的资源约束信息;根据资源约束信息生成分时段的弹性伸缩任务,并根据弹性伸缩任务对目标任务执行过程中不同时间段下的资源进行资源申请或资源选定,确定完成资源申请或资源选定后的资源为目标资源。本申请能够提高机器学习任务中资源的利用率,降低机器学习的任务成本。

    大规模分布式作业状态控制方法、装置、终端及存储介质

    公开(公告)号:CN113326147A

    公开(公告)日:2021-08-31

    申请号:CN202110544547.8

    申请日:2021-05-19

    Abstract: 本发明公开了一种大规模分布式作业状态控制方法、装置、终端及存储介质,方法包括:接收目标消息体,其中,所述目标消息体是当目标作业的子任务状态发生变更时生成的;根据接收到所述目标消息体的接收时间戳和所述目标消息体的生成时间戳确定消息传输延迟时刻;若在所述消息传输延迟时刻前没有接收到新的所述目标消息体,则根据在所述消息传输延迟时刻前存储的所述目标消息体对所述目标作业的状态值进行更新处理。本发明可以避免作业管理系统中显示的作业状态值与实际状态不符。

    基于插件化的多场景Kubernetes任务提交方法

    公开(公告)号:CN112328385B

    公开(公告)日:2021-04-06

    申请号:CN202110000926.0

    申请日:2021-01-04

    Abstract: 本发明公开了基于插件化的多场景Kubernetes任务提交方法,方法包括:将用户任务模块转译成标准任务模板;为标准任何模板设置对应的影响因子;对具有影响因子的标准任务模板进行检查,筛选出符合预设条件的标准任务模板;对符合预设条件的标准任务模板进行修饰;将修饰后的标准任务模板与唯一的调度器进行绑定,得到绑定后的标准任务模板;将绑定后的标准任务模板设置操作策略,并在设置完成后提交至Kubernetes资源管理服务。本发明将提交任务中所涉及的处理逻辑插件化,当提交任务时,可调用所有的插件运行,既能保证多场景任务成功运行,又能保持任务提交系统自身的可维护性和处理逻辑的松耦合。

Patent Agency Ranking