-
公开(公告)号:CN118627535A
公开(公告)日:2024-09-10
申请号:CN202410879988.7
申请日:2024-07-02
Applicant: 之江实验室
Abstract: 本申请涉及一种基于值分布的多智能体协同控制方法、装置、设备和介质,方法包括:构建每个智能体的初始价值网络和多个智能体的初始分布混合网络;基于各智能体的采样数据,对初始分布混合网络和各智能体的价值网络进行训练,通过最小化全局价值分布的损失函数优化初始分布混合网络以及各智能体的价值网络的网络参数,并满足全局价值分布的期望最大、每个智能体的确定性价值最大的约束关系,得到训练好的各智能体的价值网络;根据自身的观测及训练好的价值网络,各智能体执行各自的最优动作。本申请通过在训练过程中综合考虑全局观测、在执行过程中智能体仅利用局部观测做出最优决策方法。
-
公开(公告)号:CN117933346A
公开(公告)日:2024-04-26
申请号:CN202410339613.1
申请日:2024-03-25
Applicant: 之江实验室
IPC: G06N3/0895 , G06N3/092 , G06N3/0455 , G06N3/0464
Abstract: 本发明公开了一种基于自监督强化学习的即时奖励学习方法,获取高维图像数据集,高维图像数据集中包括若干带有终止状态成功或者失败标识的图像;利用高维图像数据集训练自监督学习模型,得到对应的低维特征;利用高维图像数据带有的终止状态的标识,基于低维特征,得到成功特征和失败特征;利用监督学习方法训练状态转移模型,并利用状态转移模型预测的下一状态信息和两类特征进行比较分类,得到即时奖励;基于即时奖励,利用强化学习方法进行决策。本发明可以减少强化学习方法中奖励的人工设计及标注,使得即时奖励的获取智能化。同时,这种即时奖励学习方法可以扩充强化学习的应用范围,扩展了强化学习框架的实际应用,具有广阔的场景。
-
公开(公告)号:CN117574949A
公开(公告)日:2024-02-20
申请号:CN202410067319.X
申请日:2024-01-17
Applicant: 之江实验室
Abstract: 本申请涉及一种基于值分布的多智能体协同控制方法、装置、设备和介质,基于值分布的多智能体协同控制方法包括:构建每个智能体的初始价值网络和多个智能体的初始分布混合网络;基于各所述智能体的采样数据,对所述初始分布混合网络和各所述智能体的初始价值网络进行训练,通过最小化所述全局价值分布的损失函数优化所述分布混合网络以及各所述智能体的价值网络的网络参数,并满足全局价值分布的期望最大、每个智能体的确定性价值最大的约束关系,得到训练好的各所述智能体的价值网络;根据自身的观测及训练好的价值网络,各所述智能体执行各自的所述最优动作,扩展了神经网络表达能力,提高多智能体系统更高效的决策和合作,提升整体性能和效果。
-
公开(公告)号:CN117351571A
公开(公告)日:2024-01-05
申请号:CN202311448990.0
申请日:2023-11-01
Applicant: 之江实验室 , 上海人工智能创新中心
IPC: G06V40/20 , G06V20/40 , G06V10/74 , G06N3/0464 , G06N3/08
Abstract: 本申请涉及智能识别领域,特别是涉及一种目标实时跟踪的姿态识别方法、装置、计算机设备和存储介质。所述方法包括:利用至少两个相机分别获取包括目标对象的第一视频流;当各所述第一视频流中分别包含多个对象时,基于各所述对象与所述目标对象的相似度,对所述目标对象进行跟踪;获取各所述第一视频流的各视频帧中目标对象的关键点的二维坐标,并基于相同时刻的至少两个二维坐标,得到各时刻的目标对象的关键点的三维坐标;基于所述各时刻的目标对象的关键点的三维坐标,识别所述目标对象的姿态。本发明能够在多个对象的情况下依然能够准确地识别并跟踪目标对象,进而实现鲁棒和准确的三维姿态识别。
-
公开(公告)号:CN117826867A
公开(公告)日:2024-04-05
申请号:CN202410240296.8
申请日:2024-03-04
Applicant: 之江实验室
IPC: G05D1/695 , G05D109/20
Abstract: 本申请涉及一种无人机集群路径规划方法、装置和存储介质,其中,该无人机集群路径规划方法包括:通过根据预设的连续课程学习框架确定各无人机的任务成功范围;在任务成功范围内,根据各无人机获取到的局部观测状态信息和各无人机的自身性能约束信息,对应用于无人机的无人机集群路径规划模型进行训练;根据各无人机的存活状态或预设的训练时间确定训练是否结束;若是,则输出最后训练得到的目标无人机集群路径规划模型;根据目标无人机集群路径规划模型输出待规划的各无人机实际航行路径。提高了无人机自主学习课和应对复杂的三维环境的能力,提高了路径规划的准确性。
-
公开(公告)号:CN117519160A
公开(公告)日:2024-02-06
申请号:CN202311521734.X
申请日:2023-11-15
Applicant: 之江实验室
IPC: G05D1/43 , G05D1/242 , G05D1/246 , G05D1/633 , G05D109/10
Abstract: 本申请涉及一种智能体路径规划方法、装置、电子装置和存储介质,其中,该智能体路径规划方法包括:针对目标动态环境构建实时路径规划器;根据实时路径规划器,构建强化学习模型;根据强化学习模型搭建深度强化学习算法的神经网络结构;根据奖励函数和预设的仿真环境对深度强化学习算法的神经网络结构进行训练,得到训练完备的目标深度强化学习算法的神经网络结构;通过目标深度强化学习算法的神经网络结构,对实时路径规划器的输入进行处理,得到针对智能体的移动控制指令。解决了在未知动态环境中智能体因其学习能力较低,导致避障准确度和效率均较低的问题,提高了智能体避障的准确度和效率。
-
公开(公告)号:CN119519823B
公开(公告)日:2025-05-13
申请号:CN202510058886.3
申请日:2025-01-15
Applicant: 之江实验室
IPC: H04B7/185
Abstract: 本发明公开了一种星群协同实现遥感任务的区域覆盖方法及装置,涉及卫星遥感技术领域,该方法中卫星探测任务区域后建立第一覆盖地图,以及在探测到障碍物时,在障碍物的位置释放信息素来标记该障碍物,然后基于障碍物的位置以及信息素的释放时间生成第一信息素地图。在通信范围内该卫星可与其他卫星建立通信,基于通信获取的地图对第一覆盖地图和第一信息素地图进行更新,得到第三覆盖地图和第三信息素地图。再结合第三覆盖地图和第三信息素地图确定卫星集群的未覆盖区域,从未覆盖区域中选择目标区域作为卫星的下一覆盖区域,以解决目前多星协同覆盖技术中由于无法高效避开未知障碍物、非覆盖区域导致的覆盖率低和重复覆盖率高的技术问题。
-
公开(公告)号:CN117953351B
公开(公告)日:2024-07-23
申请号:CN202410355666.2
申请日:2024-03-27
Applicant: 之江实验室
IPC: G06V10/82 , G06V10/44 , G06V10/77 , G06N3/092 , G06N3/0895 , G06N3/0985 , G06N3/0464 , G06N3/0455
Abstract: 本发明公开了一种基于模型强化学习的决策方法,包括:获取高维图像数据集;利用自监督学习方法从所述高维图像数据集中学习对应的低维特征;在低维特征空间中,利用Transformer架构构建强化学习的世界模型;利用构建的世界模型向前想象若干步,根据想象轨迹的回报进行前向搜索,得出最优策略。与随机决策相比,这种方法减少决策的随机性,可以提高决策效率,根据智能体现有的决策能力进行决策,克服了样本效率过低、增加了处理动态环境中不确定性的能力,进而达到更优且稳健的策略。
-
公开(公告)号:CN118196183A
公开(公告)日:2024-06-14
申请号:CN202410319903.X
申请日:2024-03-20
Applicant: 之江实验室 , 上海人工智能创新中心
IPC: G06T7/70
Abstract: 本申请涉及动脉瘤形态学参数的提取方法、装置和计算机设备。确定待检测动脉瘤模型的原始中心线、前向中心线和后向中心线;将前向中心线中与原始中心线的相对距离大于距离阈值的点位确定为第一分离点,将后向中心线中与原始中心线的相对距离大于距离阈值的点位确定为第二分离点;其中前向中心线与后向中心线的方向相反,原始中心线用于指示待检测动脉瘤模型的每一切面所对应的中心点;分别基于第一分离点处的第一动脉瘤半径和第二分离点处的第二动脉瘤半径,确定待检测动脉瘤模型的上游瘤颈点和下游瘤颈点;根据上游瘤颈点、下游瘤颈点和待检测动脉瘤模型的几何关系计算待检测动脉瘤模型的形态学参数。本方法能够提高形态学参数获取的准确性。
-
公开(公告)号:CN117826867B
公开(公告)日:2024-06-11
申请号:CN202410240296.8
申请日:2024-03-04
Applicant: 之江实验室
IPC: G05D1/695 , G05D109/20
Abstract: 本申请涉及一种无人机集群路径规划方法、装置和存储介质,其中,该无人机集群路径规划方法包括:通过根据预设的连续课程学习框架确定各无人机的任务成功范围;在任务成功范围内,根据各无人机获取到的局部观测状态信息和各无人机的自身性能约束信息,对应用于无人机的无人机集群路径规划模型进行训练;根据各无人机的存活状态或预设的训练时间确定训练是否结束;若是,则输出最后训练得到的目标无人机集群路径规划模型;根据目标无人机集群路径规划模型输出待规划的各无人机实际航行路径。提高了无人机自主学习课和应对复杂的三维环境的能力,提高了路径规划的准确性。
-
-
-
-
-
-
-
-
-