-
公开(公告)号:CN115953665A
公开(公告)日:2023-04-11
申请号:CN202310221030.4
申请日:2023-03-09
Applicant: 武汉人工智能研究院 , 中国科学院自动化研究所
IPC: G06V10/82 , G06V10/764 , G06V10/52 , G06V10/25 , G06N3/0464 , G06N3/0455 , G06N3/048 , G06N3/047 , G06N3/08
Abstract: 本申请实施例提供一种目标检测方法、装置、设备及存储介质,涉及图形数据读取技术领域,所述方法包括:基于视觉transformer模型获取的查询特征图序列和支持特征图序列进行相关性汇聚运算的结果,确定第二查询特征图序列;基于第二查询特征图序列的自注意力运算和/或交叉注意力运算的结果,确定用于获取查询特征图序列的查询图像对应的预测结果。本申请提供的目标检测方法,极大地缩短了视觉transformer模型的收敛时间,降低了利用该模型预测边界框的难度,既能有效地提取查询图像中和支持类别相关的目标特征区域,同时能够使查询分支不局限于特定支持类别目标实例,能检测任意类别的目标实例。
-
公开(公告)号:CN114782291A
公开(公告)日:2022-07-22
申请号:CN202210715667.4
申请日:2022-06-23
Applicant: 中国科学院自动化研究所
IPC: G06T5/00 , G06K9/62 , G06V10/774
Abstract: 本发明提供一种图像生成器的训练方法、装置、电子设备和可读存储介质,涉及图像处理技术领域,通过将降质样本人脸图像输入至图像生成器中得到修复样本人脸图像,图像生成器基于Transformer模型构建;基于原始样本人脸图像和修复样本人脸图像对图像判别器以及图像生成器进行优化;重复优化图像判别器以及优化图像生成器的步骤,直至达到预设收敛条件,以通过优化后的图像生成器对待修复人脸图像进行图像盲修复处理,实现了端对端的图像盲修复功能,训练过程不需要人工干预,训练路径比较简单,克服了现有技术中单个阶段无法获得理想的训练结果、训练过程需要人工干预和训练路径繁琐复杂的缺陷。
-
公开(公告)号:CN114429636B
公开(公告)日:2022-07-12
申请号:CN202210353468.3
申请日:2022-04-06
Applicant: 中国科学院自动化研究所
Abstract: 本发明提供一种图像扫描识别方法、装置及电子设备,该方法包括:对于当前次迭代,根据掩码区域,与下一帧局部图片进行图像块匹配后进行图像拼接同时更新下次迭代需要的掩码区域;最初掩码区域是基于对初始帧局部图片进行文本检测的结果获取的;对于拼接后的整体图片,若满足预设条件,则进行文本检测,并在文本检测结果满足预设识别条件的情况下,对拼接图片进行文本识别;继续执行下一次迭代,直到扫描笔停止扫描;根据每次迭代过程中得到的拼接图片的文本识别结果,获取扫描笔的图像扫描结果。本发明实现在计算资源和存储资源受限的低配置设备上达到良好实时性的同时,提高了图像拼接和识别的效率和精度。
-
公开(公告)号:CN114861842B
公开(公告)日:2022-10-28
申请号:CN202210797903.1
申请日:2022-07-08
Applicant: 中国科学院自动化研究所
IPC: G06K9/62
Abstract: 本发明提供一种少样本目标检测方法、装置和电子设备;涉及机器视觉技术领域。该方法包括:采用包括基础类别的第一样本数据训练得到第一模型,第一模型包括支持分支、查询分支,第一模型的支持分支用于提取基础类别的类别特征;采用包括新类别的第二样本数据对第一模型进行微调,得到第二模型,第二模型的支持分支用于提取基础类别和新类别的类别特征,第二样本的数量远小于第一样本的数量;将待检测样本输入第二模型的查询分支,提取待检测样本的第一特征;将第一特征与第二模型的类别特征进行特征重加权处理,得到处理后的第二特征,利用第二特征确定待检测样本的检测结果。本发明能够提高少样本检测器的性能。
-
公开(公告)号:CN114782291B
公开(公告)日:2022-09-06
申请号:CN202210715667.4
申请日:2022-06-23
Applicant: 中国科学院自动化研究所
IPC: G06T5/00 , G06K9/62 , G06V10/774
Abstract: 本发明提供一种图像生成器的训练方法、装置、电子设备和可读存储介质,涉及图像处理技术领域,通过将降质样本人脸图像输入至图像生成器中得到修复样本人脸图像,图像生成器基于Transformer模型构建;基于原始样本人脸图像和修复样本人脸图像对图像判别器以及图像生成器进行优化;重复优化图像判别器以及优化图像生成器的步骤,直至达到预设收敛条件,以通过优化后的图像生成器对待修复人脸图像进行图像盲修复处理,实现了端对端的图像盲修复功能,训练过程不需要人工干预,训练路径比较简单,克服了现有技术中单个阶段无法获得理想的训练结果、训练过程需要人工干预和训练路径繁琐复杂的缺陷。
-
公开(公告)号:CN113743332A
公开(公告)日:2021-12-03
申请号:CN202111050476.2
申请日:2021-09-08
Applicant: 中国科学院自动化研究所
Abstract: 本发明属于机器学习和数据质量评价领域,具体涉及了一种基于通用视觉预训练模型的图像质量评价方法及系统,旨在解决现有技术在缺乏大量人工筛查的情况下,视频监控的图像和视频质量评价的效率和精度低的问题。本发明包括:获取存在设定类别异常的图像样本集,进行异常筛查和标注;通过筛查和标注后的第一训练样本集进行样本收集模型训练;设定训练好的样本收集模型的收集阈值,并在线收集带视频帧图像质量评价标注的第二训练样本集;通过第二训练样本集进行图像质量异常分类模型训练;通过训练好的图像质量异常分类模型在线进行视频帧图像和/或单帧图像的质量异常分类。本发明人工介入少,视频监控的图像和视频质量评价的效率、准确性和精度高。
-
公开(公告)号:CN117423108B
公开(公告)日:2024-05-24
申请号:CN202311273241.9
申请日:2023-09-28
Applicant: 中国科学院自动化研究所 , 武汉人工智能研究院
IPC: G06V20/70 , G06V10/40 , G06V10/80 , G06V10/82 , G06F18/25 , G06F40/289 , G06F40/30 , G06F16/35 , G06N3/0455
Abstract: 本发明提供一种指令微调多模态大模型的图像细粒度描述方法及系统,涉及计算机技术领域,方法包括:获取目标图像对应的第一向量序列,目标图像对应的第一向量序列是通过对目标图像对应的第二向量序列进行编码后得到的,目标图像对应的第二向量序列是根据从所述目标图像中提取到的高级语义信息得到的;根据第一向量序列和第一提示模板,获取目标图像的细粒度描述文本,第一提示模板用于提供对目标图像进行细粒度描述所需的指令信息。本发明能够基于少量对图像进行细粒度描述所需的指令信息及承载图像的高级语义信息的向量序列,精准地识别和描述图像中重要目标的属性和特征,实现对图像的细粒度描述,提供更丰富及更具体的图像信息。
-
公开(公告)号:CN115953665B
公开(公告)日:2023-06-02
申请号:CN202310221030.4
申请日:2023-03-09
Applicant: 武汉人工智能研究院 , 中国科学院自动化研究所
IPC: G06V10/82 , G06V10/764 , G06V10/52 , G06V10/25 , G06N3/0464 , G06N3/0455 , G06N3/048 , G06N3/047 , G06N3/08
Abstract: 本申请实施例提供一种目标检测方法、装置、设备及存储介质,涉及图形数据读取技术领域,所述方法包括:基于视觉transformer模型获取的查询特征图序列和支持特征图序列进行相关性汇聚运算的结果,确定第二查询特征图序列;基于第二查询特征图序列的自注意力运算和/或交叉注意力运算的结果,确定用于获取查询特征图序列的查询图像对应的预测结果。本申请提供的目标检测方法,极大地缩短了视觉transformer模型的收敛时间,降低了利用该模型预测边界框的难度,既能有效地提取查询图像中和支持类别相关的目标特征区域,同时能够使查询分支不局限于特定支持类别目标实例,能检测任意类别的目标实例。
-
公开(公告)号:CN114343612B
公开(公告)日:2022-05-24
申请号:CN202210232829.9
申请日:2022-03-10
Applicant: 中国科学院自动化研究所
Abstract: 本发明属于机器视觉、数据识别领域,具体涉及一种基于Transformer的非接触式呼吸率测量方法、系统、装置,旨在解决现有的呼吸率测量方法获得的模型泛化能力差,进一步导致测量的呼吸率精度较差的问题。本发明方法包括:获取设定时间段内包含人脸信息的待测视频帧序列;基于待测视频帧序列,通过人脸检测模型和人脸关键点模型获取人脸感兴趣区域图像序列;基于人脸感兴趣区域图像序列,通过训练好的端到端Transformer模型获取设定时间段内的呼吸率序列。本发明提升了呼吸率的测量精度。
-
公开(公告)号:CN114429636A
公开(公告)日:2022-05-03
申请号:CN202210353468.3
申请日:2022-04-06
Applicant: 中国科学院自动化研究所
Abstract: 本发明提供一种图像扫描识别方法、装置及电子设备,该方法包括:对于当前次迭代,根据掩码区域,与下一帧局部图片进行图像块匹配后进行图像拼接同时更新下次迭代需要的掩码区域;最初掩码区域是基于对初始帧局部图片进行文本检测的结果获取的;对于拼接后的整体图片,若满足预设条件,则进行文本检测,并在文本检测结果满足预设识别条件的情况下,对拼接图片进行文本识别;继续执行下一次迭代,直到扫描笔停止扫描;根据每次迭代过程中得到的拼接图片的文本识别结果,获取扫描笔的图像扫描结果。本发明实现在计算资源和存储资源受限的低配置设备上达到良好实时性的同时,提高了图像拼接和识别的效率和精度。
-
-
-
-
-
-
-
-
-