-
公开(公告)号:CN117391199A
公开(公告)日:2024-01-12
申请号:CN202311293961.1
申请日:2023-10-08
Applicant: 西北工业大学
Abstract: 本发明涉及一种基于反事实遗憾最小化的机器人对抗决策方法,属于机器人对抗技术领域。包括:获取双方的位置信息;使用离散的动作集合简化决策空间;使用态势评估函数对当前双方位置姿态进行评估,将态势评估函数作为决策依据;建立不完美信息博弈模型,将双方机器人的动作选择和位置变化过程用博弈树来表示;在建立的博弈树模型上,进行博弈树的搜索,选择纳什均衡作为下一步的动机动作。本发明方法通过信息集和序列转化,将同时动作转化为序列,考虑参与者的同时动作,确保算法能够处理多方参与的情况;同时通过引入蒙特卡洛采样和反事实后悔最小化算法,有效提高子博弈搜索的效率和实时性。
-
公开(公告)号:CN117195729A
公开(公告)日:2023-12-08
申请号:CN202311176103.9
申请日:2023-09-12
Applicant: 西北工业大学
IPC: G06F30/27 , G06N3/006 , G06F111/06 , G06F111/04
Abstract: 本发明公开了一种具有时间窗约束的多无人机多目标协同分配方法及系统,根据无人机目标的可打击窗口建立无人机多目标分配的优化模型,将无人机目标上限、目标打击窗口、目标打击序列作为优化模型的约束条件;基于约束条件,结合拍卖阶段和一致性阶段对优化模型进行无人机的多目标分配,通过拍卖阶段和一致性阶段的迭代得到无人机协同目标分配结果,防止因为信息的局部性而与其余智能体产生冲突解,通过在两个阶段之间的迭代过程,得到多智能体协同目标分配结果,并实现冲突消解,通过约束条件来评价的目标效果和目标分配效果,增加了无人机目标分配的智能化水平,提高无人机的目标成功打击的概率,克服了单重目标分配的局限性的问题。
-
公开(公告)号:CN119167990A
公开(公告)日:2024-12-20
申请号:CN202411269917.1
申请日:2024-09-11
Applicant: 西北工业大学
IPC: G06N3/045 , G06N3/0442 , G06N3/0985 , G06N3/092 , G06N3/0895 , G06F17/16
Abstract: 本申请提供一种基于邻域随机网络蒸馏的搜救无人机集群探索方法,包括:初始化无人机状态,以及无人机训练中的网络参数、超参数;将无人机的联合观测构建为邻域观测数据,通过编码层将邻域观测转变为邻域表征;邻域表征通过邻域随机网络中的注意力模块得到注意力权重;邻域表征通过邻域随机网络中的通信模块得到通信权重;注意力权重和通信权重通过输出层得到无人机集群的探索表征,计算内在奖励;将内在奖励和环境奖励加权计算得到综合奖励;更新无人机训练的网络参数,进行下一轮迭代,得到无人机集群控制模型。本发明方法能够使无人机集群在奖励稀疏的搜救环境中充分利用无人机之间的邻域关系实现对环境的高效探索,实现无人机集群智能控制。
-
公开(公告)号:CN117930880A
公开(公告)日:2024-04-26
申请号:CN202410101283.2
申请日:2024-01-24
Applicant: 西北工业大学
IPC: G05D1/495 , G05D1/46 , G05D101/15 , G05D109/20
Abstract: 本发明公开了一种结合强化学习与博弈论的无人机空战决策方法及系统,通过深度强化学习实现对无人机高维、连续状态及策略空间的非线性建模,展现出强大的适应性,能够实时响应复杂、动态的环境;在进行决策网络的训练构建过程中,根据空战双方无人机的视线角对空战态势进行了划分,同时设计了无人机双网络对抗训练,令敌方无人机使用先前训练好的模型进行决策,这使得无人机的决策性能进一步提升,本发明将双方无人机的空战过程视为一个二人零和马尔科夫博弈模型,以博弈的纳什均衡解作为双方的最优机动策略,增强了策略的可解释性、为无人机的空战决策提供了理论支撑。
-
-
-