一种基于记忆增强学习的无人机自主避障导航方法

    公开(公告)号:CN115016534B

    公开(公告)日:2025-04-25

    申请号:CN202210620004.4

    申请日:2022-06-02

    Abstract: 本发明公开了一种基于记忆增强学习的无人机自主避障导航方法,克服了传统深度强化学习导航方法在部分可测环境中极易陷入局部困境的问题。首先把无人机自主避障导航问题建模为目标驱动的马尔可夫决策过程,提出动态相对目标的目标特征提取方法,引导无人机学习导航问题的本质特征;然后考虑到传统导航方法由于没有保存历史信息,导致无人机在部分可测环境中极易陷入局部困境,本发明设计了一种保存动作记忆和空间信息的记忆增强模块,在决策时额外考虑历史的观测以及动作序列,使无人机更易脱离困境;最后本发明提出基于高斯分布探索增强的深度强化学习算法,使其能够在提高算法收敛速度的前提下保持并提高无人机避障导航的成功率。

    一种星载模型部署方法、装置、存储介质及电子设备

    公开(公告)号:CN118861998B

    公开(公告)日:2025-01-21

    申请号:CN202411335914.3

    申请日:2024-09-24

    Abstract: 本说明书公开了一种星载模型部署方法、装置、存储介质及电子设备。在本说明书提供的星载模型部署方法中,获取预先训练的基座大模型和星载基座模型,并将所述星载基座模型传输给目标卫星;确定待部署的目标星载模型所面向的目标任务领域;针对所述目标任务领域训练所述基座大模型,得到面向所述目标任务领域的专家大模型;根据所述专家大模型训练所述星载基座模型,得到面向所述目标任务领域的增量微调模型;将所述增量微调模型传输给所述目标卫星,使所述目标卫星对所述星载基座模型和所述增量微调模型进行融合,得到目标星载模型。

    基于对抗技能嵌入和分层强化学习的战斗机飞行控制方法

    公开(公告)号:CN118759921B

    公开(公告)日:2024-12-31

    申请号:CN202410825029.7

    申请日:2024-06-25

    Abstract: 本发明公开了一种基于对抗技能嵌入和分层强化学习的战斗机飞行控制方法,其设计了基于对抗生成式算法和深度强化学习算法共同组成的对抗技能嵌入学习框架,利用专家飞行数据由AI算法自动学习底层控制指令到宏机动技能的映射,并通过复用这些宏机动技能,显著降低下游空战任务的学习难度,大幅压缩强化学习算法的收敛时间,提升空战智能体的博弈性能,并赋予了空战智能体更高的灵活性和快速迁移能力,为空战智能体的实用化训练和部署探明了一条新技术路径。

    一种基于核聚变领域大模型的等离子体破裂归因方法

    公开(公告)号:CN118132944A

    公开(公告)日:2024-06-04

    申请号:CN202311363768.0

    申请日:2023-10-19

    Abstract: 本说明书公开了一种基于核聚变领域大模型的等离子体破裂归因方法,根据可控核聚变实验的实验数据通过多模态判别器确定破裂先兆事件、破裂先兆事件的发生时刻及发生置信度,并通过核聚变大模型基于破裂先兆事件、破裂先兆事件的发生时刻及发生置信度确定各破裂先兆事件之间的连接关系,并以此确定可控核聚变实验对应的破裂事件链,从而根据破裂事件链确定等离子体破裂的原因。可见,通过上述方案,通过核聚变大模型和多模态判别器充分利用可控核聚变多模态、碎片化的实验数据和专家经验,实现对等离子体破裂原因的分析,进而基于等离子体破裂的原因确定下一次实验的控制决策,从而提升可控核聚变实验的迭代效率。

Patent Agency Ranking