-
公开(公告)号:CN115268493A
公开(公告)日:2022-11-01
申请号:CN202210880483.3
申请日:2022-07-25
Applicant: 中南大学
Abstract: 本发明公开了一种基于双层强化学习的大规模多无人机任务调度方法,包括如下步骤:建立多无人机任务路径规划数学模型,并基于多无人机任务路径规划数学模型建立马尔可夫决策过程;构建包括上层模型和下层模型的分而治之框架,上层模型为基于Transformer模型的深度强化学习模型,用于处理多无人机任务分配;下层模型为基于注意力机制的深度强化学习模型,用于规划每个无人机的可行任务路径;采用交互式训练方法训练上层模型与下层模型;基于训练后的双层强化学习模型对大规模多无人机任务进行调度。本发明应用于无人机调度领域,能够有效地应用于大规模多无人机任务调度问题中,并且具有良好的泛化性。
-
公开(公告)号:CN115268493B
公开(公告)日:2025-02-14
申请号:CN202210880483.3
申请日:2022-07-25
Applicant: 中南大学
IPC: G05D1/46 , G05D1/695 , G06F18/20 , G06N3/0455 , G06N3/048 , G06N3/0464 , G06N3/092 , G05D109/20
Abstract: 本发明公开了一种基于双层强化学习的大规模多无人机任务调度方法,包括如下步骤:建立多无人机任务路径规划数学模型,并基于多无人机任务路径规划数学模型建立马尔可夫决策过程;构建包括上层模型和下层模型的分而治之框架,上层模型为基于Transformer模型的深度强化学习模型,用于处理多无人机任务分配;下层模型为基于注意力机制的深度强化学习模型,用于规划每个无人机的可行任务路径;采用交互式训练方法训练上层模型与下层模型;基于训练后的双层强化学习模型对大规模多无人机任务进行调度。本发明应用于无人机调度领域,能够有效地应用于大规模多无人机任务调度问题中,并且具有良好的泛化性。
-