一种三维人体姿态估计方法

    公开(公告)号:CN110097639B

    公开(公告)日:2023-04-18

    申请号:CN201910201559.3

    申请日:2019-03-18

    Abstract: 公开一种三维人体姿态估计方法,其在不需要高配置硬件支持、和精准人体模型的条件下,实现实时且高精度的三维人体姿态估计。该方法包括步骤:(1)建立与对象匹配的三维人体模型,该模型为可见球面分布约束点云人体模型;(2)面向人体姿态跟踪的人体模型与深度点云匹配优化;(3)基于动态数据库检索的姿态跟踪错误恢复。

    一种基于矩阵变量变分自编码器的图像处理方法

    公开(公告)号:CN108932705B

    公开(公告)日:2022-05-03

    申请号:CN201810675121.4

    申请日:2018-06-27

    Abstract: 本发明公开一种基于矩阵变量变分自编码器进行图像处理的方法,能够解决图像向量化处理破坏空间结构的问题,进而利于图像重构、去噪和补全。与传统VAE不同的是,本方法用图像的固有表示形式‑2D矩阵来描述模型的输入、隐层特征、潜变量分布特征参数等,通过利用矩阵高斯分布的定义及相关性质推导新模型的目标函数的显式表达,然后利用随机梯度下降算法求解模型参数。在这个模型中,由于本发明涉及的建模过程都是面向矩阵变量的,因此能更好的建模图像数据的空间结构和统计信息,进而可以提升图像重构质量、更好去除噪声和图像补全。

    一种基于时域语义特征的弱监督时序动作检测方法

    公开(公告)号:CN113283282A

    公开(公告)日:2021-08-20

    申请号:CN202110262515.9

    申请日:2021-03-10

    Abstract: 一种基于时域语义特征的弱监督时序动作检测方法属于计算机视觉视频领域,弱监督时序动作检测任务是在仅依靠视频级别标签的情况下,对未修剪的长视频中的每一段动作进行时序上的定位和分类。目前的方法还是将时序动作检测任务视为动作识别的变体任务,他们着重在模型的特征提取、提名生成、分类器训练等方面做研究,却忽视了该任务视频本身的时域语义特征。本发明首先归纳了长视频时域语义特征:动作片段在时序上的稀疏性、相邻片段之间的语义特征具有相似性而距离较远的片段间语义特征具有差异性等,并基于此设计一种新的网络模型来提升视频分类和时序定位的精度。本发明性能超过了目前的先进方法。

    一种基于3D-Ghost模块的多模态训练单模态测试的动态手势识别方法

    公开(公告)号:CN113239824A

    公开(公告)日:2021-08-10

    申请号:CN202110544122.7

    申请日:2021-05-19

    Abstract: 本发明涉及一种基于3D‑Ghost模块的多模态训练单模态测试的动态手势识别方法,用于解决多模态训练单模态测试的动态手势识别问题,具体利用RGB数据和深度数据训练整体网络,整体网络采用并行双通道协作学习的结构,旨在通过不同模态网络之间传递知识来改善学习过程,通道m用于通过RGB数据识别动态手势,通道n用于通过深度数据识别动态手势;训练完成后,将RGB数据输入通道m进行动态手势识别,或者将深度数据输入通道n进行动态手势识别;其中通道采用I3D网络并对其进行改进,改进之处在于增加了注意力模块,部分3D卷积层替换为3D‑Ghost模块,对所有Inception‑V1子模块进行改进。

    一种基于判别矩阵变量受限玻尔兹曼机的图像识别方法

    公开(公告)号:CN109978080B

    公开(公告)日:2021-06-25

    申请号:CN201910297655.2

    申请日:2019-04-15

    Abstract: 本发明公开一种基于判别式矩阵变量受限玻尔兹曼机模型的图像识别方法,采用基于判别的矩阵变量受限玻尔兹曼机用于二维图像分类,记为DisMVRBM,此模型能够直接对图像进行建模,而不需要向量化,保留了原始样本的结构信息。与MVRBM相比,本模型增加了标签层,意味着在提取特征的过程中融入了标签信息,使得提取的特征具有判别性,会提升分类性能;并且由于增加了标签层本模型可以直接当作一个独立的分类器,不用再链接其他的分类器,省去了对其他分类器的微调训练阶段。

    基于对抗网络的单帧深度图像三维模型重建方法及装置

    公开(公告)号:CN112634438A

    公开(公告)日:2021-04-09

    申请号:CN202011555713.6

    申请日:2020-12-24

    Abstract: 基于对抗网络的单帧深度图像三维模型重建方法及装置,不需要人工设计复杂的特征算法,避免了复杂的相机校准及精细的流程设计,并具备了重建对象被遮挡区域的能力,不仅提高了重建精度,而且能够在提升对象细节质量的同时,抑制冗余形状的增生。方法包括:(1)在生成器部分,利用胶囊编码器将输入的单帧深度图像编码为多个潜在胶囊,然后利用注意力解码器将这些潜在胶囊解码并融合生成一个3D初始形状;(2)在判别器部分,通过与生成器的整体对抗学习,优化所述3D初始形状;(3)在优化器部分,对所述3D初始形状进行局部结构优化,生成3D细化形状。

    一种基于RGB数据的单视角和多视角三维重建方法及装置

    公开(公告)号:CN112365581A

    公开(公告)日:2021-02-12

    申请号:CN202011281969.2

    申请日:2020-11-17

    Abstract: 一种基于RGB数据的单视角和多视角三维重建方法及装置,能够充分利用输入图像的个性特征和其属于特定类别的共性特征,以及物体自身的几何信息来增强三维重建效果,能够获得高精度的三维重建结果。方法包括:(1)融合输入视角的个性化特征和其所属类别的共性化特征,重建得到初始化的三维体素;(2)在初始化的三维体素基础上,利用体素在特定视角下的先验对称性和本身具有的内部上下文依赖关系指导体素注意力图结构的构建,基于体素注意力图结构,利用多尺度图卷积对初始体素进行细化处理。

    一种基于联合动态图卷积的点云分割方法

    公开(公告)号:CN111583263A

    公开(公告)日:2020-08-25

    申请号:CN202010364651.4

    申请日:2020-04-30

    Abstract: 本发明涉及一种基于联合动态图卷积的点云数据自动分割方法,包括:设计并实现联合动态图卷积层用于局部特征提取,具体地,联合动态图卷积层首先根据输入计算得到各点的K近邻连边点构建图,因此经过每个联合动态图卷积层构建的图在训练中都是动态变化的。之后联合所有浅层的特征图,将所有K近邻连边点的浅层特征向量拼接后,再经过MLP并进行最大池化后得到该点的输出特征向量,然后将所有点的输出特征向量组合得到点云特征图;基于联合动态图卷积层构建深度神经网络;强化网络训练目标,训练时在经典的交叉熵损失函数的基础上增加点的类特征相似约束,以优化网络的训练。最后将待测点云输入训练好的网络中得到点云分割结果。

Patent Agency Ranking