智能体任务学习方法及装置

    公开(公告)号:CN114298302A

    公开(公告)日:2022-04-08

    申请号:CN202111539729.2

    申请日:2021-12-15

    Abstract: 本发明提供一种智能体任务学习方法及装置,该方法包括:基于自然策略梯度算法,以智能体在各历史任务下的状态信息作为样本,以智能体在各历史任务下的动作信息为样本标签,对动作预测模型的第一策略参数进行迭代更新,获取各历史任务对应的动作预测模型的最优第一策略参数;将所有历史任务对应的关键影响因子和所有历史任务对应的最优第一策略参数作为训练样本集,对任务学习模型进行迭代训练;将新任务对应的关键影响因子输入训练后的任务学习模型中,得到任务学习模型输出的新任务对应的动作预测模型的最优第二策略参数。本发明实现智能体同时具备领域任务的通用知识提炼能力和对新任务的零样本策略生成能力。

    机器人控制策略迁移方法、装置及系统

    公开(公告)号:CN113050433B

    公开(公告)日:2021-09-14

    申请号:CN202110603540.9

    申请日:2021-05-31

    Inventor: 刘智勇 吴亮东

    Abstract: 本发明提供一种机器人控制策略迁移方法、装置及系统,由于在实际状态与基于任务策略确定的参考状态的差值在预设范围外时引入了差异策略,通过任务策略与差异策略的双策略协同迁移,可以保证任务策略在实际控制系统的应用效果,使得实际控制系统对目标机器人的控制更加准确,实现待执行任务的顺利执行。

    机器人控制策略迁移方法、装置及系统

    公开(公告)号:CN113050433A

    公开(公告)日:2021-06-29

    申请号:CN202110603540.9

    申请日:2021-05-31

    Inventor: 刘智勇 吴亮东

    Abstract: 本发明提供一种机器人控制策略迁移方法、装置及系统,由于在实际状态与基于任务策略确定的参考状态的差值在预设范围外时引入了差异策略,通过任务策略与差异策略的双策略协同迁移,可以保证任务策略在实际控制系统的应用效果,使得实际控制系统对目标机器人的控制更加准确,实现待执行任务的顺利执行。

    基于权重生成的增量式小样本目标检测方法及系统

    公开(公告)号:CN112819110B

    公开(公告)日:2021-06-29

    申请号:CN202110420700.6

    申请日:2021-04-19

    Abstract: 本发明属于计算机视觉领域,具体涉及了一种基于权重生成的增量式小样本目标检测方法及系统,旨在解决现有目标检测器缺乏小样本快速学习和增量学习的能力,对标签数据依赖性强,检测器不具备开放性的问题。本发明包括:通过基础类别数据进行检测器监督训练;获取基础类别目标检测器的尺度感知和中心度感知的权重,生成基础类别响应;结合基础类别响应生成新类别权重;结合新类别数据进行基础类别目标检测器的微调训练;通过获得的基础类别和新类别的目标检测器实现增量式小样本目标检测。本发明结合尺度和中心度感知,区域特征更具代表性,目标定位更准确,模型在增量学习中可获得更好的整体性能,检测效率高、准确性和精度高。

    一种应用于大规模非规则结构数据的图搜索方法

    公开(公告)号:CN105335524B

    公开(公告)日:2019-09-24

    申请号:CN201510872650.X

    申请日:2015-11-27

    Abstract: 本发明提出了一种应用于大规模非规则结构数据的图搜索方法,包括数据预处理方法和查询执行方法,其中数据预处理方法为:将非规则结构数据进行格式统一,为每个图的原图点构造一近邻标签向量表,构造具有属性点的扩充图;查询执行方法为:在原图数据点中利用一近邻标签筛选与关键点对应的候选匹配点,计算候选匹配点的匹配度并选择局部区域的中心点,在中心点周围划分出局部区域并查询子图和局部图的近似图匹配。该算法在保证搜索准确性的同时,大幅度降低运算复杂度,可以实现可行且有效的大规模非规则结构数据的图搜索。

    一种有效的工厂设备优化布局方法

    公开(公告)号:CN103246940A

    公开(公告)日:2013-08-14

    申请号:CN201310177392.4

    申请日:2013-05-14

    Abstract: 本发明公开了一种工厂设备优化布局方法,该方法对工厂设备的布局建立模型,模型以以下形式给出:min F(X)=tr(AXBTXT+CXT)s.t.X∈Π,其中是三个规模相同的矩阵,损耗矩阵A表示设备间单位耗损,距离矩阵B表示地点间差异;C表示维护费用矩阵,是待求的分配矩阵,其形式为置换矩阵,Π是置换矩阵集,tr(*)表示矩阵的迹。然后本发明基于逐步非凸逐步凹过程对所述模型的目标函数进行优化。本发明的方法在保持很高的布局精度的同时,能大幅度降低时间消耗和存储消耗。

    机械臂的避障方法、装置、电子设备和存储介质

    公开(公告)号:CN117921661A

    公开(公告)日:2024-04-26

    申请号:CN202410101694.1

    申请日:2024-01-24

    Abstract: 本发明提供一种机械臂的避障方法、装置、电子设备和存储介质,其中方法包括:获取机械臂的初始运行轨迹,以及待检测图像;基于注意力机制,以及所述初始运行轨迹中机械臂的各臂端位置和所述待检测图像中各障碍物的障碍物位置,确定在所述初始运行轨迹中的避让障碍物;基于所述避让障碍物,调整所述初始运行轨迹,得到待执行运行轨迹。本发明提供的方法、装置,通过注意力机制在多障碍物的场景下进行在线重新规划机械臂的运行轨迹,实现了在存在突发多个障碍物的情况下,能够实现快速、准确的避障规划,提升了机械臂进行避障规划的通用性。

    机器人状态预测方法、装置、电子设备及存储介质

    公开(公告)号:CN117733874A

    公开(公告)日:2024-03-22

    申请号:CN202410188144.8

    申请日:2024-02-20

    Abstract: 本发明涉及机器人状态预测技术领域,提供一种机器人状态预测方法、装置、电子设备及存储介质,其中方法包括:识别遥操作视频中机器人的机器臂,并确定机器臂的关节位置;以遥操作视频的图像帧中所述机器臂的关节位置作为节点,以机器臂的关节位置之间的关系作为节点间的边构建时间图结构;对时间图结构进行卷积,得到机器臂的动态图,将机器臂的动态图输入至机器人状态预测模型中,得到模型输出的机器人的预测轨迹。使用遮挡感知时序图编码构建一个时间图结构,聚合每个节点的邻域信息并更新节点特征,且机器臂的动态图利用时间相关性,捕获机器人关节位置的变化,减轻关节遮挡并减少了预测误差,从而提高后续机器人状态预测的准确性和可靠性。

    主动域适应语义分割模型训练方法及装置

    公开(公告)号:CN117635933A

    公开(公告)日:2024-03-01

    申请号:CN202311541147.7

    申请日:2023-11-17

    Abstract: 本发明提供一种主动域适应语义分割模型训练方法及装置,该主动域适应语义分割模型训练方法包括:获取源域样本数据和目标域样本数据;根据域鉴别器和高斯密度函数计算目标域样本数据对应的领域分数,并对目标域样本数据的不确定性进行预测;根据领域分数和不确定性预测结果构建获取函数,根据获取函数计算目标域样本数据的目标区域,并对目标区域进行标注,得到新的样本数据;根据源域样本数据和新的样本数据构建监督损失,并根据监督损失对预训练的语义分割模型进行训练,得到目标语义分割模型。本发明所述方法通过引入领域性分数和预测不确定性设计动态平衡策略,提高了语义分割模型在域适应场景下的语义分割性能。

Patent Agency Ranking