-
公开(公告)号:CN113837348B
公开(公告)日:2024-12-10
申请号:CN202110858503.2
申请日:2021-07-28
Applicant: 中国科学院自动化研究所
IPC: G06N3/02 , G06N3/08 , A63F13/847 , A63F13/822
Abstract: 本发明提供一种基于强化学习的变化环境多智能体控制方法与装置,包括:将当前环境信息和各个智能体的隐含状态输入到智能体网络,得到智能体网络输出的各个智能体的观测动作价值;观测动作价值用于表征对应智能体当前执行所有动作的预估价值;基于各个智能体的观测动作价值,控制各个智能体执行动作;智能体网络是基于样本环境信息和样本智能体的样本隐含状态,联合自加权网络进行强化学习得到的;自加权网络用于确定所有样本智能体执行动作的联合动作价值;在强化学习过程中,自加权网络的输入包括智能体网络输出的所有样本智能体的样本观测动作价值。本发明提供的方法与装置能避免变化环境中智能体数量动态变化对多智能体控制及训练过程的影响。
-
公开(公告)号:CN113837348A
公开(公告)日:2021-12-24
申请号:CN202110858503.2
申请日:2021-07-28
Applicant: 中国科学院自动化研究所
IPC: G06N3/02 , G06N3/08 , A63F13/847 , A63F13/822
Abstract: 本发明提供一种基于强化学习的变化环境多智能体控制方法与装置,包括:将当前环境信息和各个智能体的隐含状态输入到智能体网络,得到智能体网络输出的各个智能体的观测动作价值;观测动作价值用于表征对应智能体当前执行所有动作的预估价值;基于各个智能体的观测动作价值,控制各个智能体执行动作;其中,智能体网络是基于样本环境信息和样本智能体的样本隐含状态,联合自加权网络进行强化学习得到的;自加权网络用于确定所有样本智能体执行动作的联合动作价值;在强化学习过程中,自加权网络的输入包括智能体网络输出的所有样本智能体的样本观测动作价值。本发明提供的方法与装置能够避免变化环境中智能体数量动态变化对训练过程的影响。
-
公开(公告)号:CN114943857A
公开(公告)日:2022-08-26
申请号:CN202111501858.2
申请日:2021-12-09
Applicant: 中国科学院自动化研究所 , 中国长峰机电技术研究设计院
IPC: G06V10/764 , G06V10/82 , G06V10/766 , G06V10/46 , G06N3/04 , G06N3/08
Abstract: 本发明提供一种样本目标检测方法和装置,其中,方法包括:获取待检测样本;将所述待检测样本输入校准的分类网络,得到对应的目标类别。本发明通过聚合全局和局部上下文知识以增强少样本目标检测任务中的RoI特征的工作,避免过拟合问题,这有助于为前景和背景类别学习更稳健的边界。
-
公开(公告)号:CN115147342B
公开(公告)日:2025-02-14
申请号:CN202111518629.1
申请日:2021-12-13
Applicant: 中国科学院自动化研究所 , 中国长峰机电技术研究设计院
IPC: G06T7/00 , G06N3/0464 , G06N3/048 , G06N3/08 , G06V10/774 , G06V10/80 , G06V10/82 , G06V10/764 , G06V10/762
Abstract: 本发明提供一种视觉关系检测方法、电子设备、存储介质和程序产品,该视觉关系检测方法包括:确定待检测图像,将待检测图像输入至视觉关系检测模型,获得视觉关系检测模型输出的视觉关系检测结果;其中,视觉关系检测模型是基于包括可见类和不可见类的图像训练集训练得到的,可见类为标注有视觉关系标签的图像,不可见类为未标注有视觉关系标签的图像。本发明可以预先学习可见类和不可见类对应的视觉关系,从而实现对包含不可见类的图像进行准确检测,最终实现零样本的视觉关系检测。
-
公开(公告)号:CN115147342A
公开(公告)日:2022-10-04
申请号:CN202111518629.1
申请日:2021-12-13
Applicant: 中国科学院自动化研究所 , 中国长峰机电技术研究设计院
IPC: G06T7/00 , G06N3/04 , G06N3/08 , G06V10/774 , G06V10/80 , G06V10/82 , G06V10/764 , G06V10/762
Abstract: 本发明提供一种视觉关系检测方法、电子设备、存储介质和程序产品,该视觉关系检测方法包括:确定待检测图像,将待检测图像输入至视觉关系检测模型,获得视觉关系检测模型输出的视觉关系检测结果;其中,视觉关系检测模型是基于包括可见类和不可见类的图像训练集训练得到的,可见类为标注有视觉关系标签的图像,不可见类为未标注有视觉关系标签的图像。本发明可以预先学习可见类和不可见类对应的视觉关系,从而实现对包含不可见类的图像进行准确检测,最终实现零样本的视觉关系检测。
-
-
-
-