-
公开(公告)号:CN118115804A
公开(公告)日:2024-05-31
申请号:CN202410279218.9
申请日:2024-03-12
Applicant: 西安电子科技大学
IPC: G06V10/764 , G06V10/80 , G06V10/52 , G06V10/766 , G06V10/82 , G06N3/0464
Abstract: 本发明公开了基于半弦偏移与知识蒸馏的旋转目标检测方法,包括以下步骤;步骤1,构建教师网络与学生网络联合训练的知识蒸馏检测框架;步骤2,构建教师网络的特征金字塔,输出教师的多尺度特征图;步骤3,构建教师和学生的骨干网络的残差级联特征蒸馏模块,得到学生的多尺度特征图;步骤4,构建半弦偏移表征模块,将特征图输入半弦偏移表征模块,输出的分类分支结果;步骤5,对分类分支结果和回归分支结果进行逻辑蒸馏,得到检测结果图像。本发明通过设计旋转框表征范式,并结合知识蒸馏框架来提高小模型的建模能力,以解决上述现有技术的缺点以提高遥感目标检测的精度。
-
公开(公告)号:CN117975565A
公开(公告)日:2024-05-03
申请号:CN202410208172.1
申请日:2024-02-26
Applicant: 西安电子科技大学
IPC: G06V40/20 , G06V10/764 , G06V10/44 , G06V10/82 , G06N3/0464 , G06N3/08
Abstract: 一种基于时空扩散和并行Transformer的动作识别系统及方法,系统包括:特征提取模块、两分支Transformer网络、局部运动激励模块、时空扩散模块和视频分类器模块;方法包括:首先将输入视频送入特征提取模块,然后将提取到的视频特征分别送入两分支Transformer网络结构,第一分支由深度可分离卷积和并行Transformer模块构成,第二分支由交叉Transformer模块构成,其次,提出轻量化的局部运动激励模块,该模块可插入到任意Transformer网络中,然后,通过时空扩散模块融合两分支结构得到的时空特征,增强视频长距离时序依赖,最后,借助视频分类器模块输出视频动作识别的结果;本发明具有提升模型识别精度和降低模型训练成本的技术效果。
-
公开(公告)号:CN118229732A
公开(公告)日:2024-06-21
申请号:CN202410328961.9
申请日:2024-03-21
Applicant: 西安电子科技大学
IPC: G06T7/246 , G06V20/40 , G06V10/25 , G06V10/764 , G06V10/766 , G06V10/771 , G06V10/77 , G06V10/82 , G06N3/045 , G06N3/0464 , G06N3/048 , G06N3/0499 , G06N3/084 , G06N3/0895
Abstract: 一种基于对比学习的视频目标跟踪系统及方法,系统包括:特征提取模块、对比学习头、跟踪头、动态模板更新模块和损失函数计算模块;方法包括:将搜索帧、模板和动态模板图像输入特征提取模块中,得到输出搜索帧对比特征、模板对比特征、输出搜索帧特征;将搜索帧对比特征和模板对比特征均输入对比学习头中进行特征映射,将搜索帧特征输入跟踪头中,输出目标包围框,将特征映射结果进行对比学习损失函数计算,对目标包围框进行分类损失和回归损失函数计算,得到对比学习、分类损失和回归损失函数损失值再进行加和得到总损失值,利用总损失值进行反向传播;将当前搜索帧置信度用于动态模板更新模块的更新;本发明具有跟踪精度高和适应范围广的优点。
-
-