-
公开(公告)号:CN115016534B
公开(公告)日:2025-04-25
申请号:CN202210620004.4
申请日:2022-06-02
IPC: G05D1/46 , G05D109/20
Abstract: 本发明公开了一种基于记忆增强学习的无人机自主避障导航方法,克服了传统深度强化学习导航方法在部分可测环境中极易陷入局部困境的问题。首先把无人机自主避障导航问题建模为目标驱动的马尔可夫决策过程,提出动态相对目标的目标特征提取方法,引导无人机学习导航问题的本质特征;然后考虑到传统导航方法由于没有保存历史信息,导致无人机在部分可测环境中极易陷入局部困境,本发明设计了一种保存动作记忆和空间信息的记忆增强模块,在决策时额外考虑历史的观测以及动作序列,使无人机更易脱离困境;最后本发明提出基于高斯分布探索增强的深度强化学习算法,使其能够在提高算法收敛速度的前提下保持并提高无人机避障导航的成功率。
-
公开(公告)号:CN118861998B
公开(公告)日:2025-01-21
申请号:CN202411335914.3
申请日:2024-09-24
Applicant: 之江实验室
IPC: G06F18/25 , G06N5/04 , G06N3/0895
Abstract: 本说明书公开了一种星载模型部署方法、装置、存储介质及电子设备。在本说明书提供的星载模型部署方法中,获取预先训练的基座大模型和星载基座模型,并将所述星载基座模型传输给目标卫星;确定待部署的目标星载模型所面向的目标任务领域;针对所述目标任务领域训练所述基座大模型,得到面向所述目标任务领域的专家大模型;根据所述专家大模型训练所述星载基座模型,得到面向所述目标任务领域的增量微调模型;将所述增量微调模型传输给所述目标卫星,使所述目标卫星对所述星载基座模型和所述增量微调模型进行融合,得到目标星载模型。
-
公开(公告)号:CN117933070A
公开(公告)日:2024-04-26
申请号:CN202410022577.6
申请日:2024-01-05
Applicant: 之江实验室
IPC: G06F30/27 , G01T1/16 , G06F18/213 , G06F18/214 , G06N3/045 , G06N3/0464 , G06N3/049 , G06N3/08 , G06F123/02 , G06F113/08
Abstract: 本说明书公开了一种辐射分布预测模型的训练方法、装置及存储介质,该辐射分布预测模型包括第一特征提取层、第一权重调整层及辐射分布输出层,通过第一特征提取层提取该采样信号序列的特征,该第一特征提取层提取的特征包含时间信息。此外,通过第一权重调整层可对提取的特征进行权重调整,以提高输出的预测辐射分布的准确性。最终,通过辐射分布输出层提取时序特征,这是由于采样信号序列包括了时间信息,因此,可获取到辐射分布的时序演化规律,提取时序特征。根据该时序特征,得到预测的每个时刻对应的等离子体的预测辐射分布图像。通过辐射分布预测模型构架辐射分布图像,提高了构建辐射分布图像的效率及准确性。
-
公开(公告)号:CN118759921B
公开(公告)日:2024-12-31
申请号:CN202410825029.7
申请日:2024-06-25
Applicant: 之江实验室
IPC: G05B19/042
Abstract: 本发明公开了一种基于对抗技能嵌入和分层强化学习的战斗机飞行控制方法,其设计了基于对抗生成式算法和深度强化学习算法共同组成的对抗技能嵌入学习框架,利用专家飞行数据由AI算法自动学习底层控制指令到宏机动技能的映射,并通过复用这些宏机动技能,显著降低下游空战任务的学习难度,大幅压缩强化学习算法的收敛时间,提升空战智能体的博弈性能,并赋予了空战智能体更高的灵活性和快速迁移能力,为空战智能体的实用化训练和部署探明了一条新技术路径。
-
公开(公告)号:CN117933070B
公开(公告)日:2024-07-05
申请号:CN202410022577.6
申请日:2024-01-05
Applicant: 之江实验室
IPC: G06F30/27 , G01T1/16 , G06F18/213 , G06F18/214 , G06N3/045 , G06N3/0464 , G06N3/049 , G06N3/08 , G06F123/02 , G06F113/08
Abstract: 本说明书公开了一种辐射分布预测模型的训练方法、装置及存储介质,该辐射分布预测模型包括第一特征提取层、第一权重调整层及辐射分布输出层,通过第一特征提取层提取该采样信号序列的特征,该第一特征提取层提取的特征包含时间信息。此外,通过第一权重调整层可对提取的特征进行权重调整,以提高输出的预测辐射分布的准确性。最终,通过辐射分布输出层提取时序特征,这是由于采样信号序列包括了时间信息,因此,可获取到辐射分布的时序演化规律,提取时序特征。根据该时序特征,得到预测的每个时刻对应的等离子体的预测辐射分布图像。通过辐射分布预测模型构架辐射分布图像,提高了构建辐射分布图像的效率及准确性。
-
公开(公告)号:CN118132944A
公开(公告)日:2024-06-04
申请号:CN202311363768.0
申请日:2023-10-19
Applicant: 之江实验室
IPC: G06F18/20 , G06F18/214 , G06N3/092
Abstract: 本说明书公开了一种基于核聚变领域大模型的等离子体破裂归因方法,根据可控核聚变实验的实验数据通过多模态判别器确定破裂先兆事件、破裂先兆事件的发生时刻及发生置信度,并通过核聚变大模型基于破裂先兆事件、破裂先兆事件的发生时刻及发生置信度确定各破裂先兆事件之间的连接关系,并以此确定可控核聚变实验对应的破裂事件链,从而根据破裂事件链确定等离子体破裂的原因。可见,通过上述方案,通过核聚变大模型和多模态判别器充分利用可控核聚变多模态、碎片化的实验数据和专家经验,实现对等离子体破裂原因的分析,进而基于等离子体破裂的原因确定下一次实验的控制决策,从而提升可控核聚变实验的迭代效率。
-
-
-
-
-