-
公开(公告)号:CN117953351B
公开(公告)日:2024-07-23
申请号:CN202410355666.2
申请日:2024-03-27
Applicant: 之江实验室
IPC: G06V10/82 , G06V10/44 , G06V10/77 , G06N3/092 , G06N3/0895 , G06N3/0985 , G06N3/0464 , G06N3/0455
Abstract: 本发明公开了一种基于模型强化学习的决策方法,包括:获取高维图像数据集;利用自监督学习方法从所述高维图像数据集中学习对应的低维特征;在低维特征空间中,利用Transformer架构构建强化学习的世界模型;利用构建的世界模型向前想象若干步,根据想象轨迹的回报进行前向搜索,得出最优策略。与随机决策相比,这种方法减少决策的随机性,可以提高决策效率,根据智能体现有的决策能力进行决策,克服了样本效率过低、增加了处理动态环境中不确定性的能力,进而达到更优且稳健的策略。
-
公开(公告)号:CN117826867B
公开(公告)日:2024-06-11
申请号:CN202410240296.8
申请日:2024-03-04
Applicant: 之江实验室
IPC: G05D1/695 , G05D109/20
Abstract: 本申请涉及一种无人机集群路径规划方法、装置和存储介质,其中,该无人机集群路径规划方法包括:通过根据预设的连续课程学习框架确定各无人机的任务成功范围;在任务成功范围内,根据各无人机获取到的局部观测状态信息和各无人机的自身性能约束信息,对应用于无人机的无人机集群路径规划模型进行训练;根据各无人机的存活状态或预设的训练时间确定训练是否结束;若是,则输出最后训练得到的目标无人机集群路径规划模型;根据目标无人机集群路径规划模型输出待规划的各无人机实际航行路径。提高了无人机自主学习课和应对复杂的三维环境的能力,提高了路径规划的准确性。
-
公开(公告)号:CN118155854A
公开(公告)日:2024-06-07
申请号:CN202410271436.8
申请日:2024-03-11
Applicant: 之江实验室
IPC: G16H50/50 , G16H10/60 , G16H80/00 , G06N3/0895 , G06N3/092
Abstract: 本发明公开了一种基于孪生模型的康复场景大模型训练方法,包括:获取训练数据集并进行处理,所述训练数据集中包括康复临床数据、孪生模型数据和多学科数据;获取待训练大模型,基于处理后的训练数据集,利用自监督学习方法训练所述待训练模型;对于自监督学习后的大模型,基于处理后的康复临床数据和孪生模型数据,利用监督学习方法和规范化模板进行进一步训练;对于监督学习后的大模型,基于处理后的康复临床数据,利用强化学习方法进行进一步训练大模型,其中强化学习过程中以人工反馈及相关数据作为评分机制,以引导大模型生成用户认可的创意性回答。
-
公开(公告)号:CN118155280A
公开(公告)日:2024-06-07
申请号:CN202410271438.7
申请日:2024-03-11
Applicant: 之江实验室
Abstract: 本发明公开了一种基于多模态数据频域融合的人体行为预测方法,包括:获取多模态数据并清洗数据,其中所述多模态数据包括光学运动捕捉数据、文本数据和视频数据;利用傅里叶变换把各模态的数据分别转换到频域中,得到各模态数据对应的一维频域向量;对得到的一维频域向量进行预处理,拼接为一个一维向量;利用人体行为预测模型对预处理后的一维频域向量进行处理,得到下一预测状态的融合频域信息;对所述融合频域信息进行后处理,并将得到的各模态频域预测信息利用傅里叶逆变换技术转换为各模态对应的时域预测数据。
-
公开(公告)号:CN117953351A
公开(公告)日:2024-04-30
申请号:CN202410355666.2
申请日:2024-03-27
Applicant: 之江实验室
IPC: G06V10/82 , G06V10/44 , G06V10/77 , G06N3/092 , G06N3/0895 , G06N3/0985 , G06N3/0464 , G06N3/0455
Abstract: 本发明公开了一种基于模型强化学习的决策方法,包括:获取高维图像数据集;利用自监督学习方法从所述高维图像数据集中学习对应的低维特征;在低维特征空间中,利用Transformer架构构建强化学习的世界模型;利用构建的世界模型向前想象若干步,根据想象轨迹的回报进行前向搜索,得出最优策略。与随机决策相比,这种方法减少决策的随机性,可以提高决策效率,根据智能体现有的决策能力进行决策,克服了样本效率过低、增加了处理动态环境中不确定性的能力,进而达到更优且稳健的策略。
-
公开(公告)号:CN117407689B
公开(公告)日:2024-04-19
申请号:CN202311720957.9
申请日:2023-12-14
Applicant: 之江实验室
Abstract: 本申请涉及一种面向实体对齐的主动学习方法、装置和电子装置,该方法包括:基于预设的主动学习规则,并根据知识图谱中的第一实体对,获取知识图谱中与第一实体对的特征关系满足预设条件的第二实体对;其中,第一实体对为进行实体对齐后得到的实体对;根据第一实体对和第二实体对,训练预设的图神经网络模型,并基于主动学习规则得到第三实体对,根据第三实体对更新第二实体对;当第三实体对的数量为预设的实体对数量阈值时,确定得到目标图神经网络模型。通过主动学习的方法,得到标注的实体对,进而使用标注实体对训练图神经网络模型,进而降低了在多模态知识图谱实体对齐过程中的标注成本,同时保证了实体对齐的准确性。
-
公开(公告)号:CN117251650A
公开(公告)日:2023-12-19
申请号:CN202311547326.1
申请日:2023-11-20
Applicant: 之江实验室
IPC: G06F16/9537 , G06F40/295 , G06F40/216 , G06N20/00 , G06N3/0455 , G06N3/0442 , G06N3/047 , G06N3/08
Abstract: 本申请涉及一种地理热点中心识别方法、装置、计算机设备和存储介质。所述方法包括:获取网络热点文本数据,所述网络热点文本数据包括未标注样本,将所述未标注样本输入初始标注模型,得到标注地理名称标签的训练样本,将所述标注地理名称标签的训练样本输入初始焦点识别模型,通过设定焦点判定规则,将所述训练样本中符合规则要求的位置信息赋予焦点属性,得到初始地理热点中心,基于所述初始地理热点中心和标准样本集训练所述初始标注模型和初始焦点识别模型,得到目标地理热点中心识别模型,将待识别网络热点文本输入目标地理热点中心识别模型,得到目标地理热点中心,提高了自然灾害地理热点中心识别的准确率。
-
公开(公告)号:CN117826867A
公开(公告)日:2024-04-05
申请号:CN202410240296.8
申请日:2024-03-04
Applicant: 之江实验室
IPC: G05D1/695 , G05D109/20
Abstract: 本申请涉及一种无人机集群路径规划方法、装置和存储介质,其中,该无人机集群路径规划方法包括:通过根据预设的连续课程学习框架确定各无人机的任务成功范围;在任务成功范围内,根据各无人机获取到的局部观测状态信息和各无人机的自身性能约束信息,对应用于无人机的无人机集群路径规划模型进行训练;根据各无人机的存活状态或预设的训练时间确定训练是否结束;若是,则输出最后训练得到的目标无人机集群路径规划模型;根据目标无人机集群路径规划模型输出待规划的各无人机实际航行路径。提高了无人机自主学习课和应对复杂的三维环境的能力,提高了路径规划的准确性。
-
公开(公告)号:CN117519160A
公开(公告)日:2024-02-06
申请号:CN202311521734.X
申请日:2023-11-15
Applicant: 之江实验室
IPC: G05D1/43 , G05D1/242 , G05D1/246 , G05D1/633 , G05D109/10
Abstract: 本申请涉及一种智能体路径规划方法、装置、电子装置和存储介质,其中,该智能体路径规划方法包括:针对目标动态环境构建实时路径规划器;根据实时路径规划器,构建强化学习模型;根据强化学习模型搭建深度强化学习算法的神经网络结构;根据奖励函数和预设的仿真环境对深度强化学习算法的神经网络结构进行训练,得到训练完备的目标深度强化学习算法的神经网络结构;通过目标深度强化学习算法的神经网络结构,对实时路径规划器的输入进行处理,得到针对智能体的移动控制指令。解决了在未知动态环境中智能体因其学习能力较低,导致避障准确度和效率均较低的问题,提高了智能体避障的准确度和效率。
-
公开(公告)号:CN117407689A
公开(公告)日:2024-01-16
申请号:CN202311720957.9
申请日:2023-12-14
Applicant: 之江实验室
Abstract: 本申请涉及一种面向实体对齐的主动学习方法、装置和电子装置,该方法包括:基于预设的主动学习规则,并根据知识图谱中的第一实体对,获取知识图谱中与第一实体对的特征关系满足预设条件的第二实体对;其中,第一实体对为进行实体对齐后得到的实体对;根据第一实体对和第二实体对,训练预设的图神经网络模型,并基于主动学习规则得到第三实体对,根据第三实体对更新第二实体对;当第三实体对的数量为预设的实体对数量阈值时,确定得到目标图神经网络模型。通过主动学习的方法,得到标注的实体对,进而使用标注实体对训练图神经网络模型,进而降低了在多模态知识图谱实体对齐过程中的标注成本,同时保证了实体对齐的准确性。
-
-
-
-
-
-
-
-
-