-
公开(公告)号:CN112801146A
公开(公告)日:2021-05-14
申请号:CN202110039522.2
申请日:2021-01-13
Applicant: 华中科技大学
Abstract: 本发明公开了一种目标检测方法和系统,针对目标检测任务需要自注意力关注特定类别目标对应原始图像所在区域的特点,将注意力机制运用于目标检测中,所设计的网络结构不同于通用的元学习网络框架,采用分类分支层所得的类别概率监督与特征提取层连接的类别注意力层,从而引导回归分支层进行目标位置的计算,实现基于类别区分的自监督注意力机制,提升目标检测模型的检测精度。进一步地,结合小样本目标检测任务由于小样本数量较少,网络难以学习到小样本特征的特点,将大样本图像和小样本图像进行拼接,作为样本图像对目标检测模型进行训练,使得网络兼顾学习大样本图像和小样本图像,从提升目标检测模型的对小样本的检测能力。
-
公开(公告)号:CN114741487B
公开(公告)日:2024-07-19
申请号:CN202210231146.1
申请日:2022-03-09
Applicant: 华中科技大学
IPC: G06F16/332 , G06F16/33 , G06F16/532 , G06F16/583 , G06N3/0464
Abstract: 本发明公开了一种基于图文语义嵌入的图文检索方法及系统,属于多模态深度学习领域,方法包括:利用图文语义嵌入模型对待检索目标以及数据库中各相应的待匹配对象进行特征提取;特征提取包括:图像侧特征嵌入网络以分组卷积的方式对图像进行特征提取,通过动态最大最小池化对提取到的图像特征进行编码,对编码结果进行标准化处理得到图像特征嵌入向量;文本侧特征嵌入网络对文本进行特征提取,得到文本特征嵌入向量;对图像特征嵌入向量和文本特征嵌入向量进行向量拼接与交叉后输入联合嵌入网络,以得到相应图像文本对的相似度;将相似度最高的预设数量个待匹配对象作为检索结果,并输出检索结果及相应的相似度。
-
公开(公告)号:CN112200102B
公开(公告)日:2023-02-14
申请号:CN202011103590.2
申请日:2020-10-15
Applicant: 华中科技大学
IPC: G06V40/10 , G06V10/774 , G06V10/82 , G06N3/0464 , G06N3/047
Abstract: 本发明公开了一种自适应数据增强的二维人体姿态估计方法和系统,属于计算机视觉和深度学习领域。本发明不同于将数据增强作为一个独立的数据预处理步骤的常规做法,将数据增强和用于执行计算机视觉任务的卷积神经网络的训练两个独立的过程联合起来,使得数据增强能跟随卷积神经网络的训练过程实现动态更新,自适应的根据具体数据集特点和应用任务产生数据增强操作的概率分布,产生对卷积神经网络优化更加有效的训练样本,提升卷积神经网络的训练效率,同时有效增强卷积神经网络的泛化能力;本发明以数据增强模块为生成器,以卷积神经网络为判别器,通过两者“博弈”实现共同优化,最终实现执行计算机视觉任务的卷积神经网络模型更优的表现。
-
公开(公告)号:CN111488794A
公开(公告)日:2020-08-04
申请号:CN202010113227.2
申请日:2020-02-24
Applicant: 华中科技大学
Abstract: 本发明公开了一种基于空洞卷积的自适应感受野人群密度估计方法,属于计算机视觉领域,该方法包括:对原始数据集图像和人群密度图进行切分,得到图像块和人群密度图块;构建自适应感受野人群密度估计网络并进行训练;该模型包括空洞卷积模块和分类模块;分类模块,对切分后的图像块进行分类;空洞卷积模块,根据分类模块输出的图像块类别,自适应选择对应感受野的空洞卷积子网络,对切分后的图像块进行特征提取,得到人群密度图;将待预测图片输入训练好的自适应感受野人群密度估计模型,得到人群密度估计结果。本发明方法能够自适应选择对应感受野的空洞卷积子网络进行人群密度估计,解决了透视畸变的问题,从而提高了人群密度估计的准确率。
-
公开(公告)号:CN112200102A
公开(公告)日:2021-01-08
申请号:CN202011103590.2
申请日:2020-10-15
Applicant: 华中科技大学
Abstract: 本发明公开了一种自适应数据增强的计算机视觉任务执行方法和系统,属于计算机视觉和深度学习领域。本发明不同于将数据增强作为一个独立的数据预处理步骤的常规做法,将数据增强和用于执行计算机视觉任务的卷积神经网络的训练两个独立的过程联合起来,使得数据增强能跟随卷积神经网络的训练过程实现动态更新,自适应的根据具体数据集特点和应用任务产生数据增强操作的概率分布,产生对卷积神经网络优化更加有效的训练样本,提升卷积神经网络的训练效率,同时有效增强卷积神经网络的泛化能力;本发明以数据增强模块为生成器,以卷积神经网络为判别器,通过两者“博弈”实现共同优化,最终实现执行计算机视觉任务的卷积神经网络模型更优的表现。
-
公开(公告)号:CN112801146B
公开(公告)日:2024-03-19
申请号:CN202110039522.2
申请日:2021-01-13
Applicant: 华中科技大学
IPC: G06V10/80 , G06V10/774 , G06V10/82 , G06N3/0464 , G06T3/4038
Abstract: 本发明公开了一种目标检测方法和系统,针对目标检测任务需要自注意力关注特定类别目标对应原始图像所在区域的特点,将注意力机制运用于目标检测中,所设计的网络结构不同于通用的元学习网络框架,采用分类分支层所得的类别概率监督与特征提取层连接的类别注意力层,从而引导回归分支层进行目标位置的计算,实现基于类别区分的自监督注意力机制,提升目标检测模型的检测精度。进一步地,结合小样本目标检测任务由于小样本数量较少,网络难以学习到小样本特征的特点,将大样本图像和小样本图像进行拼接,作为样本图像对目标检测模型进行训练,使得网络兼顾学习大样本图像和小样本图像,从提升目标检测模型的对小样本的检测能力。
-
公开(公告)号:CN114741487A
公开(公告)日:2022-07-12
申请号:CN202210231146.1
申请日:2022-03-09
Applicant: 华中科技大学
IPC: G06F16/332 , G06F16/33 , G06F16/532 , G06F16/583 , G06N3/04
Abstract: 本发明公开了一种基于图文语义嵌入的图文检索方法及系统,属于多模态深度学习领域,方法包括:利用图文语义嵌入模型对待检索目标以及数据库中各相应的待匹配对象进行特征提取;特征提取包括:图像侧特征嵌入网络以分组卷积的方式对图像进行特征提取,通过动态最大最小池化对提取到的图像特征进行编码,对编码结果进行标准化处理得到图像特征嵌入向量;文本侧特征嵌入网络对文本进行特征提取,得到文本特征嵌入向量;对图像特征嵌入向量和文本特征嵌入向量进行向量拼接与交叉后输入联合嵌入网络,以得到相应图像文本对的相似度;将相似度最高的预设数量个待匹配对象作为检索结果,并输出检索结果及相应的相似度。
-
-
-
-
-
-