-
公开(公告)号:CN118552956B
公开(公告)日:2024-12-03
申请号:CN202411017290.0
申请日:2024-07-29
Applicant: 济南大学 , 山东青鸟工业互联网有限公司
IPC: G06V20/70 , G06V10/764 , G06V10/80 , G06V10/82 , G06N3/0455 , G06N3/09
Abstract: 本发明提出了一种基于超分辨率Transformer的汽车零部件检测方法,涉及图像识别技术领域。本发明提出了车辆零部件检测流程,包括卷积层,注意力层和上采样卷积模块,注意力层包括Transformer模块,Transformer模块包括跨模态注意力模块和类别‑内容多头注意力模块,同时提出跨模态注意力CMA和类别‑内容多头注意力模块CCMSA,跨模态注意力CMA关注不同模态之间的关联,可以有效的融合来自不同模态的信息,类别‑内容多头注意力模块CCMSA能够利用相距较远但相似的token来增强输入特征,并在每个类别中进行关注,再进行内容分类,超越了局部窗口的限制。
-
公开(公告)号:CN118552956A
公开(公告)日:2024-08-27
申请号:CN202411017290.0
申请日:2024-07-29
Applicant: 济南大学 , 山东青鸟工业互联网有限公司
IPC: G06V20/70 , G06V10/764 , G06V10/80 , G06V10/82 , G06N3/0455 , G06N3/09
Abstract: 本发明提出了一种基于超分辨率Transformer的汽车零部件检测方法,涉及图像识别技术领域。本发明提出了车辆零部件检测流程,包括卷积层,注意力层和上采样卷积模块,注意力层包括Transformer模块,Transformer模块包括跨模态注意力模块和类别‑内容多头注意力模块,同时提出跨模态注意力CMA和类别‑内容多头注意力模块CCMSA,跨模态注意力CMA关注不同模态之间的关联,可以有效的融合来自不同模态的信息,类别‑内容多头注意力模块CCMSA能够利用相距较远但相似的token来增强输入特征,并在每个类别中进行关注,再进行内容分类,超越了局部窗口的限制。
-
公开(公告)号:CN120071000A
公开(公告)日:2025-05-30
申请号:CN202510180882.2
申请日:2025-02-19
Applicant: 济南大学 , 智联信通科技股份有限公司
IPC: G06V10/764 , G06V10/766 , G06V10/80 , G06V10/82 , G06V10/44 , G06N3/0455
Abstract: 本发明提出了基于多尺度动态融合的车轮零部件检测方法,涉及图像识别技术领域,本发明提出了车轮零部件检测流程,包括图像预处理模块,主干网络模块,特征融合模块,目标检测模块,同时提出的MSA‑T模块,DWFA模块,DAD‑Head模块,MSA‑T模块通过多尺度卷积核提取不同感受野的局部特征,自注意力机制能够捕获长距离依赖和全局上下文信息,DWFA模块通过动态权重生成机制,根据不同输入特征的贡献度自适应调整融合比例;多尺度特征的对齐和融合,在捕捉小目标的细粒度的同时,不丢失高层语义信息,DAD‑Head模块通过动态权重分配机制,专门针对分类任务和回归任务的特征需求进行优化。
-
公开(公告)号:CN118072303A
公开(公告)日:2024-05-24
申请号:CN202410479420.6
申请日:2024-04-22
Applicant: 济南大学
IPC: G06V20/68 , G06V10/764 , G06V10/82 , G06N3/0464 , G06V10/26
Abstract: 本发明提出了一种基于MLP高效token交互的食品识别方法及系统,涉及计算机视觉领域。本发明首先是根据图像特征进行分块,将其投影到更高维度的特征空间,将图像输入到混合块,然后将图像在通道维度上分割特征,将一半的通道特征输入CGSMM来建模长距离交互,将剩余的特征输入LSMM来聚合局部交互,分别有效提高了模型的token交互能力和促进了token在局部区域的聚合。
-
-
-