-
公开(公告)号:CN115147342B
公开(公告)日:2025-02-14
申请号:CN202111518629.1
申请日:2021-12-13
Applicant: 中国科学院自动化研究所 , 中国长峰机电技术研究设计院
IPC: G06T7/00 , G06N3/0464 , G06N3/048 , G06N3/08 , G06V10/774 , G06V10/80 , G06V10/82 , G06V10/764 , G06V10/762
Abstract: 本发明提供一种视觉关系检测方法、电子设备、存储介质和程序产品,该视觉关系检测方法包括:确定待检测图像,将待检测图像输入至视觉关系检测模型,获得视觉关系检测模型输出的视觉关系检测结果;其中,视觉关系检测模型是基于包括可见类和不可见类的图像训练集训练得到的,可见类为标注有视觉关系标签的图像,不可见类为未标注有视觉关系标签的图像。本发明可以预先学习可见类和不可见类对应的视觉关系,从而实现对包含不可见类的图像进行准确检测,最终实现零样本的视觉关系检测。
-
公开(公告)号:CN115147342A
公开(公告)日:2022-10-04
申请号:CN202111518629.1
申请日:2021-12-13
Applicant: 中国科学院自动化研究所 , 中国长峰机电技术研究设计院
IPC: G06T7/00 , G06N3/04 , G06N3/08 , G06V10/774 , G06V10/80 , G06V10/82 , G06V10/764 , G06V10/762
Abstract: 本发明提供一种视觉关系检测方法、电子设备、存储介质和程序产品,该视觉关系检测方法包括:确定待检测图像,将待检测图像输入至视觉关系检测模型,获得视觉关系检测模型输出的视觉关系检测结果;其中,视觉关系检测模型是基于包括可见类和不可见类的图像训练集训练得到的,可见类为标注有视觉关系标签的图像,不可见类为未标注有视觉关系标签的图像。本发明可以预先学习可见类和不可见类对应的视觉关系,从而实现对包含不可见类的图像进行准确检测,最终实现零样本的视觉关系检测。
-
公开(公告)号:CN114943857A
公开(公告)日:2022-08-26
申请号:CN202111501858.2
申请日:2021-12-09
Applicant: 中国科学院自动化研究所 , 中国长峰机电技术研究设计院
IPC: G06V10/764 , G06V10/82 , G06V10/766 , G06V10/46 , G06N3/04 , G06N3/08
Abstract: 本发明提供一种样本目标检测方法和装置,其中,方法包括:获取待检测样本;将所述待检测样本输入校准的分类网络,得到对应的目标类别。本发明通过聚合全局和局部上下文知识以增强少样本目标检测任务中的RoI特征的工作,避免过拟合问题,这有助于为前景和背景类别学习更稳健的边界。
-
公开(公告)号:CN113887647A
公开(公告)日:2022-01-04
申请号:CN202111198679.6
申请日:2021-10-14
Applicant: 浙江大学 , 中国长峰机电技术研究设计院
Abstract: 本发明公开了一种融合知识蒸馏及类代表点抽取的类增少样本对象检测方法,该方法为:将图片输入深度神经网络(CNN)提取视觉特征;基于提取的视觉特征,采用对象框提取网络预测对象可能存在的位置并对预测出的对象框进行位置标记,使用池化网络将所有对象框的视觉特征变成同一大小;基于每个候选对象框的视觉特征,使用坐标预测网络预测候选对象的精确位置,同时使用增量分类器预测该候选对象框的精确类别。该发明实现方法简单、灵活,可以显著提升全新类对象的检测性能,并改善历史类对象的检测性能。
-
公开(公告)号:CN114004295B
公开(公告)日:2024-08-02
申请号:CN202111280363.1
申请日:2021-10-29
Applicant: 浙江大学 , 中国长峰机电技术研究设计院
IPC: G06V10/764 , G06V10/74 , G06V10/40 , G06V10/82 , G06N3/0464 , G06N3/047 , G06N3/0475 , G06N3/045 , G06N3/094
Abstract: 本发明公开了一种基于对抗增强的小样本图像数据拓展方法。本发明使用新颖的生成对抗网络来学习数据增强的表示和过程,展示来自单个新的数据点的真实数据增强样本,结合辅助图重构器及多层图表示门获取增强图像与验证域图像的多层级表示聚合向量,利用源域图像构建多类原型图,将验证域图像的多层级表示聚合向量与对应类原型图之间的欧式距离作为相似度阈值,保留多层级表示聚合向量与对应类原型图之间的欧式距离小于或等于相似度阈值的增强图像,作为拓展结果。本发明在数据量少的情况下使用增强样本对小样本进行训练并进行评估,结果表明,使用增强样本可以提高标准分类器的性能,所有任务的泛化性能都有显著提高。
-
公开(公告)号:CN114004295A
公开(公告)日:2022-02-01
申请号:CN202111280363.1
申请日:2021-10-29
Applicant: 浙江大学 , 中国长峰机电技术研究设计院
Abstract: 本发明公开了一种基于对抗增强的小样本图像数据拓展方法。本发明使用新颖的生成对抗网络来学习数据增强的表示和过程,展示来自单个新的数据点的真实数据增强样本,结合辅助图重构器及多层图表示门获取增强图像与验证域图像的多层级表示聚合向量,利用源域图像构建多类原型图,将验证域图像的多层级表示聚合向量与对应类原型图之间的欧式距离作为相似度阈值,保留多层级表示聚合向量与对应类原型图之间的欧式距离小于或等于相似度阈值的增强图像,作为拓展结果。本发明在数据量少的情况下使用增强样本对小样本进行训练并进行评估,结果表明,使用增强样本可以提高标准分类器的性能,所有任务的泛化性能都有显著提高。
-
公开(公告)号:CN116226636A
公开(公告)日:2023-06-06
申请号:CN202211693753.6
申请日:2022-12-28
Applicant: 中国长峰机电技术研究设计院
IPC: G06F18/213 , G06N3/044 , G06N3/0475 , G06N3/0464 , G06N3/094 , G06N3/084
Abstract: 本发明公开了一种信号处理方法和信号处理装置,涉及信号处理技术领域,以解决现有技术中一维信号和二维信号的转换单向不可逆的问题。该信号处理方法包括:构建循环生成对抗网络,循环生成对抗网络包括第一生成器、第二生成器、第一判别器和第二判别器;采用第一生成器处理二维信号,获得转化后一维信号;利用第一判别器、一维信号和转化后一维信号,更新第一判别器和第一生成器;一维信号为二维信号对应的真实一维信号;采用第二生成器处理一维信号,获得转化后二维信号;利用第二判别器、二维信号和转化后二维信号,更新第二判别器和第二生成器。本发明还提供了包括上述信号处理方法的信号处理装置和计算机存储介质。
-
公开(公告)号:CN119238509A
公开(公告)日:2025-01-03
申请号:CN202411411896.2
申请日:2024-10-10
Applicant: 中国科学院自动化研究所
IPC: B25J9/16
Abstract: 公开了一种机器人的控制方法及装置、可读存储介质、计算机程序产品,所述方法包括:对当前工作空间内的RGB图像进行图像分割,得到RGB图像中每个物体的掩码;基于每个物体的掩码、当前工作空间的深度图像和目标物体,获取当前工作空间的场景点云,其中,场景点云中标识了当前工作空间的目标物体和非目标物体;将场景点云、机器人在当前时间帧的动作序列和从潜变量分布中采样的潜变量输入动作预测解码器,预测机器人在第一时长的动作序列,其中,潜变量分布是在训练动作预测解码器时获取的动作序列分布,第一时长包含当前时间帧后第一预定数量的时间帧;将预测的动作序列映射到机器人,以控制机器人抓取目标物体。
-
公开(公告)号:CN118269127B
公开(公告)日:2024-10-11
申请号:CN202410644334.6
申请日:2024-05-23
Applicant: 中国科学院自动化研究所
Abstract: 本发明涉及机器人技术领域,提供一种通用型仿人五指灵巧手,包括掌部、大拇指单元、食指单元、中指单元、无名指单元和小拇指单元;掌部包括手掌支架以及设于手掌支架上的大拇指腱绳驱动单元、食指腱绳驱动单元、中指腱绳驱动单元、无名指腱绳驱动单元和小拇指腱绳驱动单元;大拇指单元、食指单元、中指单元、无名指单元和小拇指单元分别与手掌支架连接,大拇指腱绳驱动单元、食指腱绳驱动单元、中指腱绳驱动单元、无名指腱绳驱动单元和小拇指腱绳驱动单元分别与大拇指单元、食指单元、中指单元、无名指单元和小拇指单元一一对应连接。本发明确保了灵巧手的仿人灵巧性,实现了对灵巧手的高度集成化设计,增强了灵巧手的通用性,降低了设计成本。
-
公开(公告)号:CN113538576B
公开(公告)日:2024-09-06
申请号:CN202110594376.X
申请日:2021-05-28
Applicant: 中国科学院自动化研究所
IPC: G06F12/109
Abstract: 本发明提供一种基于双臂机器人的抓取方法、装置及双臂机器人,所述方法包括:将目标场景深度图输入至实例分割模型,得到实例分割模型输出的抓取目标掩码和真空吸附目标掩码;基于抓取目标掩码,确定抓取目标位姿,以及基于真空吸附目标掩码,确定真空吸附目标位姿;将抓取目标位姿和真空吸附目标位姿发送至双臂机器人的执行机构,以使执行机构抓取目标场景深度图中的物体。由于训练实例分割模型时不需要采集抓取机械臂夹爪结构进行训练,使得实例分割模型能够适用于不同型号的抓取机械臂夹爪,模型泛化能力较强。本发明在准确获取抓取目标位姿和真空吸附目标位姿后,使得双臂机器人的执行机构能够准确抓取目标场景深度图中的物体,鲁棒性较强。
-
-
-
-
-
-
-
-
-