基于分布式训练框架的智能决策方法及系统

    公开(公告)号:CN119831048A

    公开(公告)日:2025-04-15

    申请号:CN202411953175.4

    申请日:2024-12-27

    Abstract: 本公开提供了一种基于分布式训练框架的智能决策方法及系统,属于人工智能和分布式计算领域,分布式训练框架包括采样器、学习器和协调服务器。智能决策方法包括:从第一策略集中选择k个策略作为训练策略,确定每个训练策略对应的采样器和学习器。将每个训练策略分别与目标策略作为一组进行对抗采样得到第一采样数据。基于第一采样数据对学习器进行训练得到学习器的网络模型参数,对网络模型参数进行聚合得到全局模型参数。将全局模型参数发送至各个学习器和各个采样器进行迭代训练得到满足预设收敛条件的目标策略集。本公开通过将同步采样与分布式并行计算相结合,使智能决策适用于复杂的军事对抗博弈场景,显著提升了策略多样性的优化效果。

Patent Agency Ranking