-
公开(公告)号:CN117671353A
公开(公告)日:2024-03-08
申请号:CN202311642374.9
申请日:2023-12-04
Applicant: 西安电子科技大学
IPC: G06V10/764 , G06V40/20 , G06V10/82 , G06V10/52 , G06V10/30 , G06N3/0455 , G06N3/09
Abstract: 动作抖动与骨架噪声抑制的多尺度时空交互骨架动作分类方法、系统、设备及介质,其方法是:首先获取待训练骨架视频样本;其次利用骨架动作识别模型的稀疏级选择模块,提取待训练骨架样本的多尺度特征,空域上,通过原始关节特征和稀疏级关节特征构建级联交互矩阵,并将多头自注意应用于通道特征的交互和扩散;时域上,利用骨架动作识别模型的时域多尺度时间卷积模块,结合多尺度滤波器和时间自注意通道交互算法,提取不同的时间特征,促进全局时间信息交互和更新;系统、设备及介质基于骨架动作分类方法,通过Transformer网络结构,实现基于骨骼数据的动作分类任务,并在已有数据集上取得了高精度的分类性能。
-
公开(公告)号:CN118506082A
公开(公告)日:2024-08-16
申请号:CN202410639986.0
申请日:2024-05-22
Applicant: 西安电子科技大学
IPC: G06V10/764 , G06V10/82 , G06V10/44 , G06V10/80 , G06N3/0464 , G06N3/048 , G06N3/08
Abstract: 一种基于非形变对象特征提取的细粒度图像分类方法,包括以下步骤;步骤1;通过CNN卷积神经网络提取整个原始输入图像的特征;步骤2,通过高频通道筛选出对图像分类起关键性作用的通道;步骤3,对高频通道进行整合并生成掩码,并取最具有差别性的连通区域作为后续的截取目标区域;步骤4,通过非形变对象区域截取策略对目标区域进行截取;步骤5,最终对原始图像特征和截取出的判别区域特征的高频通道特征图进行特征融合,在此基础上得到分类结果。本发明基于CNN提取的原始卷积特征,通过集成高频通道选择、局部判别区域定位两个模块和非形变对象区域截取策略构成一个FLNet网络分类预测,利用该方法进行分类预测著提高了细粒度视觉分类任务的性能。
-
公开(公告)号:CN119851136A
公开(公告)日:2025-04-18
申请号:CN202510042776.8
申请日:2025-01-10
Applicant: 西安电子科技大学
IPC: G06V20/10 , G06V10/80 , G06V10/82 , G06N3/0455 , G06N3/0464 , G06N3/084
Abstract: 基于非对称型神经网络的高分辨率遥感影像道路网络提取方法、系统、设备及介质,其方法是:首先获取待训练高分辨率道路遥感影像数据并进行预处理;其次通过多层预训练模型ResNet34对预处理后的道路影像数据利用编码器逐步获取道路的两层低级特征和高级特征;将编码器提取到的道路高级特征输入到高级特征优化模块AFOM对其进行优化和增强,并去除冗余特征,得到优化后的道路高级特征;最后利用解码器优化并融合道路的两层低级特征和优化后的道路高级特征,获得优化的整体模型,用损失函数softDice和BCE的综合表示优化的整体模型,通过恢复图像分辨率,最终输出提取的道路网络图;系统、设备及介质,基于非对称型神经网络的高分辨率遥感影像道路网络提取方法,对高分辨率遥感影像中的道路进行识别分割;本发明具有精确度高和鲁棒性好的优点。
-
公开(公告)号:CN118736288A
公开(公告)日:2024-10-01
申请号:CN202410786990.X
申请日:2024-06-18
Applicant: 西安电子科技大学
IPC: G06V10/764 , G06V10/80 , G06N3/0464 , G06N3/0499 , G06N3/048 , G06N3/084
Abstract: 本发明公开了一种单阶段点云密度感知的聚焦卷积3D目标检测方法,属于3D目标检测领域。所述3D目标检测方法包括以下步骤:将数据集中的点云数据动态转化成体素形态的数据,根据体素信息得到融合了点云密度、距离的体素特征;将体素特征输入到8倍下采样的残差聚焦稀疏卷积中进行高维度的特征提取;将从稀疏卷积中得到的特征转化为密集型数据并且在Z轴方向上压缩,得到BEV特征图;将BEV特征图送入双分支的卷积网络进行特征提取得到最终BEV特征;将最终BEV特征送入RPN检测头得到最终检测结果。本发明加强了单阶段3D目标检测模型对点云密度稀疏类别的敏感程度,加强了稀疏卷积对空间信息的学习能力,可用于激光雷达传感器环境下的3D目标检测。
-
公开(公告)号:CN117877119A
公开(公告)日:2024-04-12
申请号:CN202410056047.3
申请日:2024-01-15
Applicant: 西安电子科技大学
IPC: G06V40/20 , G06N3/0464 , G06V10/46 , G06V10/774 , G06V10/52 , G06V10/62 , G06V10/764 , G06V10/80 , G06V10/82
Abstract: 一种面向骨架尺度差异性特征提取的动作识别方法、系统、设备及介质,方法为:根据人体行为类别对拍摄的人体行为视频标注,得到人体动作样本;提取人体骨骼关节点的空间三维信息,创建人体关节数据集并对其进行转化,构造人体骨骼数据集和人体运动速度数据集;构建动态多尺度空间特征提取模块和多尺度时间特征提取模块、关节‑部位特征增强注意力模块及时空域结果偏向模块;将人体关节数据集、人体骨骼数据集和人体运动速度数据集分别经过构建的模块进行特征学习获得相应的识别结果,将识别结果加权融合,实现行为识别分类;系统、设备及介质用于实现该方法;本发明对多尺度骨架节点和身体部位结构有效建模,有效提高对人体行为识别模型的识别性能。
-
公开(公告)号:CN117611624A
公开(公告)日:2024-02-27
申请号:CN202311370910.4
申请日:2023-10-23
Applicant: 西安电子科技大学
Abstract: 一种基于全局运动估计视频稳定的方法,针对输入的不稳定视频,首先,通过全局运动平滑模块对视频中的光流进行平滑处理,以获得平滑的光流结果;然后,通过RF‑Net模型获取不稳定视频图像上的关键点;接着将关键点的光流作为输入,经运动估计模块的处理,将稀疏关键点的运动传播到不同的网格顶点上,得到对应的网格顶点的运动估计结果;通过运动估计模块的计算,获得网格顶点的准确运动估计;最后,将网格顶点的运动轨迹作为轨迹平滑模块的输入;在轨迹平滑模块中,计算不同时间段轨迹的动态权重,调整原始轨迹在不同时间段的贡献;通过对不同时间段的原始轨迹进行加权求和,得到稳定的轨迹;提高了视频稳定的鲁棒性和适应性,使其能够适用于多种复杂的视频抖动情况。
-
公开(公告)号:CN118691797A
公开(公告)日:2024-09-24
申请号:CN202410829642.6
申请日:2024-06-25
Applicant: 西安电子科技大学
IPC: G06V10/25 , G06V10/52 , G06V10/80 , G06V10/764 , G06V10/771 , G06V10/82 , G06V20/10 , G06N3/0464 , G06N3/048 , G06N3/045
Abstract: 一种基于大核分解网络的遥感图像多尺度目标检测方法,利用特征提取网络从遥感图像提取特征,利用特征融合网络融合特征,利用分类网络和回归网络根据融合后的特征实现目标检测,其中:特征提取网络以PVT‑v2框架为基础,并利用轻量级的卷积模块替换原transformer模块;轻量级的卷积模块包括一个LK模块和一个FFN模块,LK模块用于提取遥感图像中目标的上下文信息和特征信息,其包括两个全连接层,一个LKT模块和一个GELU激活函数;LKT模块用于将大卷积核分解,在保证与大卷积核具有相同感受野的情况下,减少网络参数和计算量,利用必要的背景信息检测目标。本发明减少了大卷积核的参数量与计算量,缓解了不同尺度目标及其特征之间的干扰,提高了模型的检测精度。
-
公开(公告)号:CN118196891A
公开(公告)日:2024-06-14
申请号:CN202410243640.9
申请日:2024-03-04
Applicant: 西安电子科技大学
IPC: G06V40/20 , G06V10/764 , G06V10/42 , G06V10/44 , G06V10/62 , G06V10/80 , G06V10/82 , G06N3/042 , G06N3/045 , G06N3/0464 , G06N3/049
Abstract: 一种基于动作注意力引导的轻量级骨架动作分类方法、系统、设备及介质,方法:获取待训练骨架视频样本;构建基于动作注意力引导的轻量级骨架动作分类模型(AL‑GCN);通过自主学习空间卷积网络(AL‑SGCN)提取空间特征,对提取完空间特征的骨架序列进行注意力修正;通过多尺度时间融合卷积网络(MS‑TFCN)对骨架关节的长距离随机依赖进行建模,实现时间特征提取;对提取完时间特征的骨架序列进行注意力修正;使用跳转模块(Jump)和多流高斯权值选择算法提升AL‑GCN模型的动作识别准确率,将生成的骨架时空特征送入分类器;系统、设备及介质用于实现该方法;本发明通过GCN网络结构,实现基于骨骼数据的动作分类任务,并在已有数据集上取得了高精度的分类性能。
-
公开(公告)号:CN118736363A
公开(公告)日:2024-10-01
申请号:CN202410781681.3
申请日:2024-06-18
Applicant: 西安电子科技大学
IPC: G06V10/80 , G06V10/77 , G06V10/774 , G06T7/246 , G06V10/56 , G06V10/82 , G06N3/0455 , G06N3/0464 , G06N3/08
Abstract: 本发明公开了一种基于Transformer的RGB‑T视觉多模态特征提取方法,主要解决现有技术在RGB‑T目标跟踪领域存在的多模态信息提取不足、多模态特征融合不充分的问题。方案包括:以RGB‑TIR图像对为输入,分别提取RGB图像的特征和TIR图像的特征,得到RGB特征向量和TIR特征向量,并处理使其形状相同;以处理后的特征向量为输入,融合模板区域特征和搜索区域特征,分别得到RGB图像和TIR图像的初始视觉提示向量;利用特征权重分配模块交互学习融合RGB特征和TIR特征,得到具有交互融合信息的加权特征,本发明能够有效提取可见光和红外图像的多模态信息,可用于RGB‑T目标跟踪领域。
-
公开(公告)号:CN117636058A
公开(公告)日:2024-03-01
申请号:CN202311713673.7
申请日:2023-12-13
Applicant: 西安电子科技大学
IPC: G06V10/764 , G06V10/44 , G06V10/82 , G06V10/80 , G06N3/045 , G06N3/0464 , G06N3/08
Abstract: 本发明公开了基于同层多尺度注意力的细粒度图像分类方法,包括以下步骤;步骤1:利用同层多尺度注意力层提取不同尺度的关键特征:步骤2:利用多尺度特征融合模块融合不同尺度的关键特征,得到多尺度注意力特征Fcondensed;步骤3:分类;将步骤2得到的多尺度注意力特征Fcondensed输入分类器获取最终的类预测。本发明通过构建同层多尺度注意力层来学习特征图中不同尺度的关键信息,以有效地挖掘细粒度图像中的全局特征和局部特征。
-
-
-
-
-
-
-
-
-