-
公开(公告)号:CN118196597A
公开(公告)日:2024-06-14
申请号:CN202410451603.7
申请日:2024-04-16
Applicant: 济南大学
IPC: G06V10/82 , G06V10/764 , G06V10/25 , G06N3/0455
Abstract: 本发明提供一种基于集中注意力的商品识别方法及系统,涉及计算机视觉领域。本发明根据图像多尺度特征图,通过前景目标token选择器来预测每个特征图的前景评分,再通过多类别分数预测器把得分较高的token确定为用于增强计算的token,将这些高分token分散回原始特征序列中,得到优化后的图像特征序列,提升了计算效率、节约了计算量,并为在高分辨率图片目标检测中权衡计算效率和模型精度提供先验知识。
-
公开(公告)号:CN118097321B
公开(公告)日:2024-09-27
申请号:CN202410524655.2
申请日:2024-04-29
Applicant: 济南大学
IPC: G06V10/764 , G06V10/80 , G06V10/82
Abstract: 本发明提出了基于CNN和Transformer的车辆图像增强方法及系统,涉及计算机视觉领域。本发明提出一种特征调制Transformer模块,模块由L个交叉精炼融合块组成,每个交叉精炼融合块由高频增强残差块、矩形窗口注意力块、混合融合块组成。其中,高频增强残差块用于从输入特征中提取高频特征,矩形窗口注意力块用于捕捉输入特征的长距离依赖关系,然后通过混合融合块整合高频增强残差块和矩形窗口注意力块的输出。最后交叉提炼全局特征以获得最佳效果。
-
公开(公告)号:CN118097321A
公开(公告)日:2024-05-28
申请号:CN202410524655.2
申请日:2024-04-29
Applicant: 济南大学
IPC: G06V10/764 , G06V10/80 , G06V10/82
Abstract: 本发明提出了基于CNN和Transformer的车辆图像增强方法及系统,涉及计算机视觉领域。本发明提出一种特征调制Transformer模块,模块由L个交叉精炼融合块组成,每个交叉精炼融合块由高频增强残差块、矩形窗口注意力块、混合融合块组成。其中,高频增强残差块用于从输入特征中提取高频特征,矩形窗口注意力块用于捕捉输入特征的长距离依赖关系,然后通过混合融合块整合高频增强残差块和矩形窗口注意力块的输出。最后交叉提炼全局特征以获得最佳效果。
-
公开(公告)号:CN118072303A
公开(公告)日:2024-05-24
申请号:CN202410479420.6
申请日:2024-04-22
Applicant: 济南大学
IPC: G06V20/68 , G06V10/764 , G06V10/82 , G06N3/0464 , G06V10/26
Abstract: 本发明提出了一种基于MLP高效token交互的食品识别方法及系统,涉及计算机视觉领域。本发明首先是根据图像特征进行分块,将其投影到更高维度的特征空间,将图像输入到混合块,然后将图像在通道维度上分割特征,将一半的通道特征输入CGSMM来建模长距离交互,将剩余的特征输入LSMM来聚合局部交互,分别有效提高了模型的token交互能力和促进了token在局部区域的聚合。
-
-
-