一种深度学习训练资源的自适应分配方法及架构

    公开(公告)号:CN116401046A

    公开(公告)日:2023-07-07

    申请号:CN202310269888.8

    申请日:2023-03-14

    Abstract: 本发明公开了一种深度学习训练资源的自适应分配方法及架构,方法包括:根据用户输入或决策推荐算法确定训练的资源配置;实时记录训练中的资源监控数据,并监控训练结果;若训练失败,则根据记录的资源监控数据得到资源结果数据,并利用自适应资源调节算法针对训练失败的资源结果数据调整训练的资源配置,重新进行训练;若训练成功,则结束训练,并根据实时的资源监控数据得到资源结果数据并记录。本发明具有动态生成推荐配置与失败自动重试、自适应优化资源分配方案的功能。

Patent Agency Ranking