-
公开(公告)号:CN114741487B
公开(公告)日:2024-07-19
申请号:CN202210231146.1
申请日:2022-03-09
Applicant: 华中科技大学
IPC: G06F16/332 , G06F16/33 , G06F16/532 , G06F16/583 , G06N3/0464
Abstract: 本发明公开了一种基于图文语义嵌入的图文检索方法及系统,属于多模态深度学习领域,方法包括:利用图文语义嵌入模型对待检索目标以及数据库中各相应的待匹配对象进行特征提取;特征提取包括:图像侧特征嵌入网络以分组卷积的方式对图像进行特征提取,通过动态最大最小池化对提取到的图像特征进行编码,对编码结果进行标准化处理得到图像特征嵌入向量;文本侧特征嵌入网络对文本进行特征提取,得到文本特征嵌入向量;对图像特征嵌入向量和文本特征嵌入向量进行向量拼接与交叉后输入联合嵌入网络,以得到相应图像文本对的相似度;将相似度最高的预设数量个待匹配对象作为检索结果,并输出检索结果及相应的相似度。
-
公开(公告)号:CN112801146B
公开(公告)日:2024-03-19
申请号:CN202110039522.2
申请日:2021-01-13
Applicant: 华中科技大学
IPC: G06V10/80 , G06V10/774 , G06V10/82 , G06N3/0464 , G06T3/4038
Abstract: 本发明公开了一种目标检测方法和系统,针对目标检测任务需要自注意力关注特定类别目标对应原始图像所在区域的特点,将注意力机制运用于目标检测中,所设计的网络结构不同于通用的元学习网络框架,采用分类分支层所得的类别概率监督与特征提取层连接的类别注意力层,从而引导回归分支层进行目标位置的计算,实现基于类别区分的自监督注意力机制,提升目标检测模型的检测精度。进一步地,结合小样本目标检测任务由于小样本数量较少,网络难以学习到小样本特征的特点,将大样本图像和小样本图像进行拼接,作为样本图像对目标检测模型进行训练,使得网络兼顾学习大样本图像和小样本图像,从提升目标检测模型的对小样本的检测能力。
-
公开(公告)号:CN114741487A
公开(公告)日:2022-07-12
申请号:CN202210231146.1
申请日:2022-03-09
Applicant: 华中科技大学
IPC: G06F16/332 , G06F16/33 , G06F16/532 , G06F16/583 , G06N3/04
Abstract: 本发明公开了一种基于图文语义嵌入的图文检索方法及系统,属于多模态深度学习领域,方法包括:利用图文语义嵌入模型对待检索目标以及数据库中各相应的待匹配对象进行特征提取;特征提取包括:图像侧特征嵌入网络以分组卷积的方式对图像进行特征提取,通过动态最大最小池化对提取到的图像特征进行编码,对编码结果进行标准化处理得到图像特征嵌入向量;文本侧特征嵌入网络对文本进行特征提取,得到文本特征嵌入向量;对图像特征嵌入向量和文本特征嵌入向量进行向量拼接与交叉后输入联合嵌入网络,以得到相应图像文本对的相似度;将相似度最高的预设数量个待匹配对象作为检索结果,并输出检索结果及相应的相似度。
-
公开(公告)号:CN112801146A
公开(公告)日:2021-05-14
申请号:CN202110039522.2
申请日:2021-01-13
Applicant: 华中科技大学
Abstract: 本发明公开了一种目标检测方法和系统,针对目标检测任务需要自注意力关注特定类别目标对应原始图像所在区域的特点,将注意力机制运用于目标检测中,所设计的网络结构不同于通用的元学习网络框架,采用分类分支层所得的类别概率监督与特征提取层连接的类别注意力层,从而引导回归分支层进行目标位置的计算,实现基于类别区分的自监督注意力机制,提升目标检测模型的检测精度。进一步地,结合小样本目标检测任务由于小样本数量较少,网络难以学习到小样本特征的特点,将大样本图像和小样本图像进行拼接,作为样本图像对目标检测模型进行训练,使得网络兼顾学习大样本图像和小样本图像,从提升目标检测模型的对小样本的检测能力。
-
-
-