-
公开(公告)号:CN115953665A
公开(公告)日:2023-04-11
申请号:CN202310221030.4
申请日:2023-03-09
Applicant: 武汉人工智能研究院 , 中国科学院自动化研究所
IPC: G06V10/82 , G06V10/764 , G06V10/52 , G06V10/25 , G06N3/0464 , G06N3/0455 , G06N3/048 , G06N3/047 , G06N3/08
Abstract: 本申请实施例提供一种目标检测方法、装置、设备及存储介质,涉及图形数据读取技术领域,所述方法包括:基于视觉transformer模型获取的查询特征图序列和支持特征图序列进行相关性汇聚运算的结果,确定第二查询特征图序列;基于第二查询特征图序列的自注意力运算和/或交叉注意力运算的结果,确定用于获取查询特征图序列的查询图像对应的预测结果。本申请提供的目标检测方法,极大地缩短了视觉transformer模型的收敛时间,降低了利用该模型预测边界框的难度,既能有效地提取查询图像中和支持类别相关的目标特征区域,同时能够使查询分支不局限于特定支持类别目标实例,能检测任意类别的目标实例。
-
公开(公告)号:CN117423108B
公开(公告)日:2024-05-24
申请号:CN202311273241.9
申请日:2023-09-28
Applicant: 中国科学院自动化研究所 , 武汉人工智能研究院
IPC: G06V20/70 , G06V10/40 , G06V10/80 , G06V10/82 , G06F18/25 , G06F40/289 , G06F40/30 , G06F16/35 , G06N3/0455
Abstract: 本发明提供一种指令微调多模态大模型的图像细粒度描述方法及系统,涉及计算机技术领域,方法包括:获取目标图像对应的第一向量序列,目标图像对应的第一向量序列是通过对目标图像对应的第二向量序列进行编码后得到的,目标图像对应的第二向量序列是根据从所述目标图像中提取到的高级语义信息得到的;根据第一向量序列和第一提示模板,获取目标图像的细粒度描述文本,第一提示模板用于提供对目标图像进行细粒度描述所需的指令信息。本发明能够基于少量对图像进行细粒度描述所需的指令信息及承载图像的高级语义信息的向量序列,精准地识别和描述图像中重要目标的属性和特征,实现对图像的细粒度描述,提供更丰富及更具体的图像信息。
-
公开(公告)号:CN115953665B
公开(公告)日:2023-06-02
申请号:CN202310221030.4
申请日:2023-03-09
Applicant: 武汉人工智能研究院 , 中国科学院自动化研究所
IPC: G06V10/82 , G06V10/764 , G06V10/52 , G06V10/25 , G06N3/0464 , G06N3/0455 , G06N3/048 , G06N3/047 , G06N3/08
Abstract: 本申请实施例提供一种目标检测方法、装置、设备及存储介质,涉及图形数据读取技术领域,所述方法包括:基于视觉transformer模型获取的查询特征图序列和支持特征图序列进行相关性汇聚运算的结果,确定第二查询特征图序列;基于第二查询特征图序列的自注意力运算和/或交叉注意力运算的结果,确定用于获取查询特征图序列的查询图像对应的预测结果。本申请提供的目标检测方法,极大地缩短了视觉transformer模型的收敛时间,降低了利用该模型预测边界框的难度,既能有效地提取查询图像中和支持类别相关的目标特征区域,同时能够使查询分支不局限于特定支持类别目标实例,能检测任意类别的目标实例。
-
公开(公告)号:CN117423108A
公开(公告)日:2024-01-19
申请号:CN202311273241.9
申请日:2023-09-28
Applicant: 中国科学院自动化研究所 , 武汉人工智能研究院
IPC: G06V20/70 , G06V10/40 , G06V10/80 , G06V10/82 , G06F18/25 , G06F40/289 , G06F40/30 , G06F16/35 , G06N3/0455
Abstract: 本发明提供一种指令微调多模态大模型的图像细粒度描述方法及系统,涉及计算机技术领域,方法包括:获取目标图像对应的第一向量序列,目标图像对应的第一向量序列是通过对目标图像对应的第二向量序列进行编码后得到的,目标图像对应的第二向量序列是根据从所述目标图像中提取到的高级语义信息得到的;根据第一向量序列和第一提示模板,获取目标图像的细粒度描述文本,第一提示模板用于提供对目标图像进行细粒度描述所需的指令信息。本发明能够基于少量对图像进行细粒度描述所需的指令信息及承载图像的高级语义信息的向量序列,精准地识别和描述图像中重要目标的属性和特征,实现对图像的细粒度描述,提供更丰富及更具体的图像信息。
-
公开(公告)号:CN114861842A
公开(公告)日:2022-08-05
申请号:CN202210797903.1
申请日:2022-07-08
Applicant: 中国科学院自动化研究所
IPC: G06K9/62
Abstract: 本发明提供一种少样本目标检测方法、装置和电子设备;涉及机器视觉技术领域。该方法包括:采用包括基础类别的第一样本数据训练得到第一模型,第一模型包括支持分支、查询分支,第一模型的支持分支用于提取基础类别的类别特征;采用包括新类别的第二样本数据对第一模型进行微调,得到第二模型,第二模型的支持分支用于提取基础类别和新类别的类别特征,第二样本的数量远小于第一样本的数量;将待检测样本输入第二模型的查询分支,提取待检测样本的第一特征;将第一特征与第二模型的类别特征进行特征重加权处理,得到处理后的第二特征,利用第二特征确定待检测样本的检测结果。本发明能够提高少样本检测器的性能。
-
公开(公告)号:CN114861842B
公开(公告)日:2022-10-28
申请号:CN202210797903.1
申请日:2022-07-08
Applicant: 中国科学院自动化研究所
IPC: G06K9/62
Abstract: 本发明提供一种少样本目标检测方法、装置和电子设备;涉及机器视觉技术领域。该方法包括:采用包括基础类别的第一样本数据训练得到第一模型,第一模型包括支持分支、查询分支,第一模型的支持分支用于提取基础类别的类别特征;采用包括新类别的第二样本数据对第一模型进行微调,得到第二模型,第二模型的支持分支用于提取基础类别和新类别的类别特征,第二样本的数量远小于第一样本的数量;将待检测样本输入第二模型的查询分支,提取待检测样本的第一特征;将第一特征与第二模型的类别特征进行特征重加权处理,得到处理后的第二特征,利用第二特征确定待检测样本的检测结果。本发明能够提高少样本检测器的性能。
-
-
-
-
-