一种基于视觉大模型的步态识别方法

    公开(公告)号:CN119672808A

    公开(公告)日:2025-03-21

    申请号:CN202411763240.7

    申请日:2024-12-03

    Abstract: 本发明公开了一种基于视觉大模型的步态识别方法。通过设计的基于Transformer的步态识别框架PSGaitFormer,有效地融合和聚合了骨骼和人体解析数列的时空信息。PSGaitFormer包括展平滑动模块、Transformer Encoder、位置融合模块、MLP‑Mix模块以及骨骼模块。本发明首次将大模型常用结构引入步态识别领域,结合图像大模型常见网络,提出大模型和步态解析数据的结合以及与人体骨架数据融合进行步态识别。本发明提供了端到端的步态识别方法,可以从摄像头采集的数据中直接得到步态识别结果,不需要人工标注数据,实现自动化识别步态,减少了人力消耗。

    一种全景目标检测方法、装置及计算机装置

    公开(公告)号:CN118865105A

    公开(公告)日:2024-10-29

    申请号:CN202410833681.3

    申请日:2024-06-26

    Abstract: 本发明涉及计算机视觉目标检测领域,具体涉及一种全景目标检测方法、装置及计算机装置。本发明的全景目标检测方法包括利用平面图像数据集构建全景图像数据集;对全景图像数据集进行标注:根据平面图像的目标掩码标注计算目标的最小外接凸多边形,将平面图像的目标最小外接凸多边形投影到球面上,得到ERP表征中目标的最小外接凸多边形,利用球面旋转卡壳算法,根据球面目标的最小外接凸多边形,计算得到球面目标的包围框标注,对于镜像填充的图像部分中不能完整包含的目标不计算包围框;选择全景目标检测的卷积神经网络模型进行训练;对模型的性能评估。本发明适用于全景目标检测。

    一种抵御中毒梯度攻击的分层联邦学习方法及装置

    公开(公告)号:CN118607659A

    公开(公告)日:2024-09-06

    申请号:CN202410576459.X

    申请日:2024-05-10

    Abstract: 本发明提供了一种抵御中毒梯度攻击的分层联邦学习方法及装置。分层联邦学习方法分为两个大部分:分层联邦学习的实现以及防御方法布局;将防御方法结合分层通讯融入联邦学习中,使得联邦学习对于中毒梯度攻击的抗性更加强的同时保留了分层联邦学习的优势。在多层次联邦学习领域,目前并没有针对中毒攻击的防御方法,也没有提出针对中毒攻击的多层次联邦学习模型。本方法的能够有效的针对中毒攻击进行防御,能够很好的保护用户的隐私问题,同时在一定情况下还能减少训练带宽。

    一种适用于多环境下的无人机目标定位方法及系统

    公开(公告)号:CN118196663A

    公开(公告)日:2024-06-14

    申请号:CN202410359775.1

    申请日:2024-03-27

    Abstract: 本发明公开了一种适用于多环境下的无人机目标定位方法及系统。首先构建用于提取输入图像特征的图像特征提取网络;然后构建用于学习图像的风格特征的风格指示网络和用于调整风格信息的Ada‑IN仿射参数生成模块;再通过两个loss函数的联合优化。最后在实际使用时,通过衡量无人机图像描述子与卫星图像描述子之间的距离,得到匹配结果,实现多环境状况下的无人机目标定位。针对不同天气下的无人机采集图像,本发明能够将图像的语义信息和风格信息进行解耦分离,而后能够对图像特征中的风格信息进行自适应调整以实现同目标不同风格图像特征的统一与对齐,从而提高多天气环境下无人机目标地理定位的精度。

    一种基于正交方向和图割优化的室内点云精确提取方法

    公开(公告)号:CN119515892A

    公开(公告)日:2025-02-25

    申请号:CN202411286384.8

    申请日:2024-09-13

    Abstract: 本发明公开了一种基于正交方向和图割优化的室内点云精确提取方法。本发明方法在点云处理和建筑信息提取中具有显著的有益效果。首先,通过正交方向估计和非线性优化,使得点云数据能够高精度对齐建筑的主要轴线,确保模型与实际结构一致。其次,该方法通过图割模型有效剔除建筑外部点云数据,减少噪声干扰,从而保留建筑内部的有效点云。此外,利用平面检测和正交约束,提高了室内空间提取的准确性和完整性。整体而言,该方法不仅自动化程度高,显著减少了手工调整需求,还具有强大的鲁棒性,即使在数据缺失或噪声存在的情况下,仍能稳健地提取建筑内部结构信息。

    基于特征分布的自适应池化方法及系统

    公开(公告)号:CN119206438A

    公开(公告)日:2024-12-27

    申请号:CN202411324371.5

    申请日:2024-09-23

    Abstract: 本发明公开了一种基于特征分布的自适应池化方法及系统,方法包括如下步骤:步骤1、制作图像数据集;步骤2、构建基于特征分布的自适应池化策略的交叉视角地理定位网络模型,并通过步骤1的数据集进行训练;步骤3、经过训练的交叉视角地理定位网络模型接收需要定位的无人机或卫星视角图像,匹配对应的卫星或无人机图像。本发明基于特征分布的自适应池化方法及系统,旨在引导网络捕获显著目标特征的同时降低对上下文特征的敏感度,以实现精准的无人机交叉视角地理定位。

    基于多尺度特征聚合网络的遥感图像显著性检测方法

    公开(公告)号:CN117809198A

    公开(公告)日:2024-04-02

    申请号:CN202410025432.1

    申请日:2024-01-08

    Abstract: 本发明公开了基于多尺度特征聚合网络的遥感图像显著性检测方法。首先进行数据集的收集和扩增;然后通过主干网络进行特征提取;再采用多尺度特征引导模块,使用不同膨胀率的膨胀卷积和特征注意力引导操作,同时融合主干网络分支的不同尺度的特征信息;对于得到的两个分支的特征通过特征对齐模块使用可变形卷积DCN来进行特征对齐聚合;最后解码最终特征生成预测图并进行损失监督。本发明提出了一种双分支架构网络来聚合两主干网络的特征,通过多尺度特征引导模块将来自不同分支的多尺度特征进行融合,更好地建模特征之间的上下文关系,增强了模型对不同尺度目标的感知能力,提高了对目标的识别和定位精度。

    一种基于多模态数据输入的步态识别方法

    公开(公告)号:CN119785413A

    公开(公告)日:2025-04-08

    申请号:CN202411264571.6

    申请日:2024-09-10

    Abstract: 本发明公开了一种基于多模态数据输入的步态识别方法。本发明步骤:1:将人体解析序列数据集以及人体骨架序列数据集转化为pkl文件;2:构造特征融合模块,该模块将人体解析模块的特征和人体骨架模块的特征进行深度融合;3:构造时空特征提取模块,时空特征提取模块的第一个分支,先使用内核大小为3的一维卷积沿时间维度提取特征,后进入ReLu激活函数,再经过卷积核后进入ReLu激活函数,通过时间维池化经过卷积核得到时间维特征向量;第二个分支再使用一维卷积沿空间维度提取特征,后续部分和时间维度分支保持一致。本发明融合了人体关键点和细粒度解析序列,同时兼顾信息的丰富性和定位的准确性,从而提升步态识别的性能。

    一种基于3D高斯的三维重建方法及计算机装置

    公开(公告)号:CN119152115A

    公开(公告)日:2024-12-17

    申请号:CN202411183048.0

    申请日:2024-08-27

    Abstract: 本发明涉及三维重建领域,具体涉及一种基于3D高斯的三维重建方法及计算机装置,提高了三维重建的精度。方法包括:采集数据,并对数据进行预处理,获取预测的深度图和法向图;通过3D Gaussian Splatting渲染得到彩色图片、法向图及深度图;将渲染得到彩色图片、法向图及深度图与训练的真值、预测的法向图、预测的深度图分别进行作差,获得损失函数;通过随机梯度下降最小化损失函数,迭代优化训练高斯的分布、形状以及颜色。本发明适用于三维重建。

    基于强化学习的场景布局估计方法

    公开(公告)号:CN118865392A

    公开(公告)日:2024-10-29

    申请号:CN202411339837.9

    申请日:2024-09-25

    Abstract: 本发明公开了基于强化学习的场景布局估计方法,涉及场景布局估计技术领域,包括如下步骤:将场景的稠密点云映射到平面上,利用形态学侵蚀进行分割,并进行合并处理,得到房间点云;再将房间点云投影到二维平面上,提取房间点云中的边缘点云,并进行分割处理,得到独立区域的壁面点云;然后基于Q‑learning算法,确定强化学习中的状态、动作和奖励;再基于独立区域的壁面点云采用Q‑learning算法拟合线段,得到独立区域的壁面线段数据;最后基于独立区域的壁面线段数据,生成场景布局模型;本发明用于解决现有技术中无法在消除了独立区域之间的干扰和遮挡物的影响的同时减少计算量,场景布局估计效率和准确性较低的问题。

Patent Agency Ranking