-
公开(公告)号:CN114708185B
公开(公告)日:2025-03-18
申请号:CN202111258992.4
申请日:2021-10-28
Applicant: 中国科学院自动化研究所
IPC: G06V10/764 , G06V10/774 , G06V10/74 , G06V10/82 , G06N3/0464 , G06N3/084
Abstract: 本发明属于计算机视觉及模式识别领域,具体涉及了一种基于大数据赋能和模型流的目标检测方法、系统及设备,旨在解决现有目标检测模型受限于训练数据导致模型性能不高,以及在不同应用场景下复用性差的问题。本发明包括:进行所有公开的目标检测数据集的整合,并以任一模型为基准搭建模型采样空间;一次训练中完成涵盖各种运行需求的动态超网;在当前场景中,通过类别的语义信息向量进行模型初始化及子模型筛选;通过当前场景数据进行子模型的预训练,最终获取的目标检测模型可进行当前场景待目标检测图像的目标检测。本发明在构建灵活的动态超网后,使用少量使用当前场景下的标注数据进行快速微调即可获得当前场景下的性能优异的目标检测模型。
-
公开(公告)号:CN114743041B
公开(公告)日:2023-01-03
申请号:CN202210225051.9
申请日:2022-03-09
Applicant: 中国科学院自动化研究所 , 华为云计算技术有限公司
IPC: G06V10/764 , G06V10/774 , G06V10/74 , G06V10/82 , G06N3/04 , G06N3/08
Abstract: 本发明提供了一种预训练模型抽选框架的构建方法及装置,该方法包括:选取图像数据集和自监督对比学习框架;根据图像数据集和自监督对比学习框架对构建的超网预训练模型进行训练,得到训练好的超网预训练模型;选取下游迁移任务和下游迁移数据集;在基于自监督对比学习框架获取的采样空间中筛选符合预设条件的第一模型,基于下游迁移任务和下游迁移数据集计算第一模型与训练好的超网预训练模型的相似度;基于相似度的计算结果,确定与训练好的超网预训练模型共享权重的目标预训练模型,得到预训练模型抽选框架。该方法可以实现高效的下游任务定制化抽取,抽取出的模型具有极佳的泛化能力。
-
公开(公告)号:CN119166236A
公开(公告)日:2024-12-20
申请号:CN202411230607.9
申请日:2024-09-03
Applicant: 中国科学院自动化研究所
Abstract: 本公开涉及计算机领域和人工智能领域,提供一种虚拟场景生成方法及系统,所述虚拟场景生成方法包括:规划智能体接收用户输入的场景生成指令;所述规划智能体根据预设资源库中的插件注释信息,从所述预设资源库中选择用于生成所述目标场景的程序化内容生成插件,生成用于生成所述目标场景的任务计划;执行智能体利用从所述预设资源库中选择的程序化内容生成插件,执行所述任务计划,以生成所述目标场景。本公开可以解决难以提升生成虚拟场景的工作效率的问题,可以自动化地生成目标场景,而无需用户深度参与PCG插件的选择、应用、调整等场景生成过程,提升工作效率。
-
公开(公告)号:CN114708185A
公开(公告)日:2022-07-05
申请号:CN202111258992.4
申请日:2021-10-28
Applicant: 中国科学院自动化研究所
Abstract: 本发明属于计算机视觉及模式识别领域,具体涉及了一种基于大数据赋能和模型流的目标检测方法、系统及设备,旨在解决现有目标检测模型受限于训练数据导致模型性能不高,以及在不同应用场景下复用性差的问题。本发明包括:进行所有公开的目标检测数据集的整合,并以任一模型为基准搭建模型采样空间;一次训练中完成涵盖各种运行需求的动态超网;在当前场景中,通过类别的语义信息向量进行模型初始化及子模型筛选;通过当前场景数据进行子模型的预训练,最终获取的目标检测模型可进行当前场景待目标检测图像的目标检测。本发明在构建灵活的动态超网后,使用少量使用当前场景下的标注数据进行快速微调即可获得当前场景下的性能优异的目标检测模型。
-
公开(公告)号:CN119166236B
公开(公告)日:2025-05-09
申请号:CN202411230607.9
申请日:2024-09-03
Applicant: 中国科学院自动化研究所
Abstract: 本公开涉及计算机领域和人工智能领域,提供一种虚拟场景生成方法及系统,所述虚拟场景生成方法包括:规划智能体接收用户输入的场景生成指令;所述规划智能体根据预设资源库中的插件注释信息,从所述预设资源库中选择用于生成所述目标场景的程序化内容生成插件,生成用于生成所述目标场景的任务计划;执行智能体利用从所述预设资源库中选择的程序化内容生成插件,执行所述任务计划,以生成所述目标场景。本公开可以解决难以提升生成虚拟场景的工作效率的问题,可以自动化地生成目标场景,而无需用户深度参与PCG插件的选择、应用、调整等场景生成过程,提升工作效率。
-
公开(公告)号:CN114743041A
公开(公告)日:2022-07-12
申请号:CN202210225051.9
申请日:2022-03-09
Applicant: 中国科学院自动化研究所
IPC: G06V10/764 , G06V10/774 , G06V10/74 , G06K9/62 , G06V10/82 , G06N3/04 , G06N3/08
Abstract: 本发明提供了一种预训练模型抽选框架的构建方法及装置,该方法包括:选取图像数据集和自监督对比学习框架;根据图像数据集和自监督对比学习框架对构建的超网预训练模型进行训练,得到训练好的超网预训练模型;选取下游迁移任务和下游迁移数据集;在基于自监督对比学习框架获取的采样空间中筛选符合预设条件的第一模型,基于下游迁移任务和下游迁移数据集计算第一模型与训练好的超网预训练模型的相似度;基于相似度的计算结果,确定与训练好的超网预训练模型共享权重的目标预训练模型,得到预训练模型抽选框架。该方法可以实现高效的下游任务定制化抽取,抽取出的模型具有极佳的泛化能力。
-
公开(公告)号:CN119516076A
公开(公告)日:2025-02-25
申请号:CN202411607289.3
申请日:2024-11-12
Applicant: 中国科学院自动化研究所
Abstract: 本发明提供了一种用于场景重建和渲染的图像处理方法、装置及设备。方法包括:初始化每张待重建场景图像对应的稀疏点云,得到多个初始高斯面元;基于初始高斯面元渲染得到的逆深度图、渲染场景图像以及法向量图,对每个初始高斯面元进行优化,得到多个第一目标高斯面元;基于第一目标高斯面元的重要性,确定第二目标高斯面元,重要性是基于多个子模型以及与每个子模型匹配的目标待重建场景图像确定的,多个子模型是对多个第一目标高斯面元进行网格划分得到的,与每个子模型匹配的目标待重建场景图像是基于待重建场景图像的位姿以及子模型的渲染结果确定的;基于网格的空间范围,确定用于渲染重建场景图像的第三目标高斯面元。
-
公开(公告)号:CN119169188A
公开(公告)日:2024-12-20
申请号:CN202411230543.2
申请日:2024-09-03
Applicant: 中国科学院自动化研究所
Abstract: 本公开涉及一种场景生成方法、装置、电子设备、存储介质和计算机程序产品,所述场景生成方法包括:获取针对目标场景的描述文本;基于描述文本通过调度代理确定第一计划,其中,第一计划包括用于生成目标场景的对象;基于对象以及预设资源库中与对象对应的预定义知识文档,通过专业代理确定包含子任务的第二计划,其中,子任务与预定义知识文档对应;基于第二计划中的子任务,通过检索代理在预设资源库中进行检索,得到与子任务对应的对象或对象操作接口;基于与子任务对应的对象或对象操作接口,通过执行代理生成目标场景。解决了场景生成的效果不佳问题。
-
公开(公告)号:CN116935107A
公开(公告)日:2023-10-24
申请号:CN202310855205.7
申请日:2023-07-12
Applicant: 中国科学院自动化研究所
IPC: G06V10/764 , G06V10/774 , G06V10/766 , G06V10/82 , G06V10/40 , G06N3/0464 , G06N3/0895 , G06N3/084
Abstract: 本发明提供一种基于互联网搜索的检测类别自扩展目标检测方法及装置,所述方法包括:将待检测图片输入至目标检测模型,得到目标检测模型输出的目标检测结果;其中,目标检测模型的训练步骤包括:基于待扩展检测类别,搜索待扩展检测类别对应的样本图片;基于样本图片以及待扩展检测类别,对初始检测模型进行训练,得到第一检测模型;将样本图片输入至第一检测模型,得到第一检测模型输出的样本图片对应的第一伪标签;基于样本图片、第一伪标签以及携带有标签的已知类别图片一同对第一检测模型进行训练,得到目标检测模型。本发明能够使得目标检测模型无需额外人工标注即可实现扩展检测类别。
-
-
-
-
-
-
-
-