一种基于单张RGB图像的双流多尺度手部姿态估计方法

    公开(公告)号:CN113052030A

    公开(公告)日:2021-06-29

    申请号:CN202110273215.0

    申请日:2021-03-11

    Abstract: 本发明涉及一种基于单张RGB图像的双流多尺度手部姿态估计方法,用于解决单张RGB图像中自遮挡、近邻关节预测歧义问题。本发明是以RGB图像作为输入,利用深度神经网络提取单张图像的特征并得到手部关节2D姿态初始坐标,利用双分支网络进行2D姿态估计,得到两路手部关节2D姿态坐标;对于两路2D姿态坐标,利用双分支的多尺度语义图U‑Net网络分别估计两路手部关节的3D坐标,然后再将两路3D坐标加和求平均,最终输出手部关节的3D坐标。本发明基于手的不同拓扑结构,更好的利用了关节之间的信息,最终实现高精度的手部姿态估计。

    一种多视角的人体行为识别方法

    公开(公告)号:CN109977787B

    公开(公告)日:2021-03-02

    申请号:CN201910156308.8

    申请日:2019-03-01

    Abstract: 公开一种多视角的人体行为识别方法,其能够有效地提取更具判别性、鲁棒的特征,从而提高了多视角的人体行为的识别精度。这种多视角的人体行为识别方法,包括以下步骤:(1)学习一组特定视角的迁移字典,使同一个动作在不同视角下的稀疏表示相同,使不同视角的动作特征迁移到稀疏空间中;(2)通过视角自适应变换模型,将稀疏表示从稀疏空间变换到新的共用空间,该模型联合学习了分布自适应模型、结构一致模型和判别信息保留模型。

    一种基于基尼指数的领域自适应语义分割方法

    公开(公告)号:CN112116593A

    公开(公告)日:2020-12-22

    申请号:CN202010781502.8

    申请日:2020-08-06

    Abstract: 本发明公开了一种基于基尼指数的领域自适应语义分割方法,利用基尼指数度量输出预测的不确定性,在输出层对目标域输出预测进行不确定性度量及约束,减小源域和目标域在类别分布上的差异,进行域间自适应;依据基尼指数对目标域预测的不确定性度量结果将目标域样本集划分为两个子集,对域内高置信度预测对应的样本利用伪标签作为弱监督信息训练域内自适应分割网络,对域内自适应分割网络两个子集的输出预测计算基尼指数图,对低置信度样本计算的基尼指数图进行约束,并利用判别器Dt判别基尼指数图属于哪个子集,基于对抗思想减小目标域域内的差异,提高语义标注精度。与现有技术相比较,本发明显著提高了目标域的语义标注准确率。

    一种用于Affordance推理的深度网络构建方法

    公开(公告)号:CN111709275A

    公开(公告)日:2020-09-25

    申请号:CN202010350248.6

    申请日:2020-04-28

    Abstract: 公开一种用于Affordance推理的深度网络构建方法,其能够描述物体间影响的不对称性,考虑不同邻居节点的差异性影响的问题,更好地刻画场景上下文中物体之间的关系。该方法包括两个部分:视觉特征提取部分和Affordance推理部分;Affordance推理部分采用门控图注意力网络(Gated Graph Attention Neural Network,GGANN),以图结构作为上下文的载体,基于对象级别的上下文信息构建双向图,对环境中物体提取视觉特征并与类别信息融合作为每个图节点的表示,图节点之间建立双向边,并引入图注意力机制更新边的权值以描述不同邻居节点间的差异性影响。

    一种三维人体姿态估计方法

    公开(公告)号:CN110097639A

    公开(公告)日:2019-08-06

    申请号:CN201910201559.3

    申请日:2019-03-18

    Abstract: 公开一种三维人体姿态估计方法,其在不需要高配置硬件支持、和精准人体模型的条件下,实现实时且高精度的三维人体姿态估计。该方法包括步骤:(1)建立与对象匹配的三维人体模型,该模型为可见球面分布约束点云人体模型;(2)面向人体姿态跟踪的人体模型与深度点云匹配优化;(3)基于动态数据库检索的姿态跟踪错误恢复。

    一种基于判别矩阵变量受限玻尔兹曼机的图像识别方法

    公开(公告)号:CN109978080A

    公开(公告)日:2019-07-05

    申请号:CN201910297655.2

    申请日:2019-04-15

    Abstract: 本发明公开一种基于判别式矩阵变量受限玻尔兹曼机模型的图像识别方法,采用基于判别的矩阵变量受限玻尔兹曼机用于二维图像分类,记为DisMVRBM,此模型能够直接对图像进行建模,而不需要向量化,保留了原始样本的结构信息。与MVRBM相比,本模型增加了标签层,意味着在提取特征的过程中融入了标签信息,使得提取的特征具有判别性,会提升分类性能;并且由于增加了标签层本模型可以直接当作一个独立的分类器,不用再链接其他的分类器,省去了对其他分类器的微调训练阶段。

    帧内预测方法
    97.
    发明公开

    公开(公告)号:CN102427530A

    公开(公告)日:2012-04-25

    申请号:CN201110306265.0

    申请日:2011-10-11

    Abstract: 帧内预测方法,包括以下步骤:(1)定义N个不同方向的模板,对应N个新帧内预测模式,N为1~9之间的任意值;采用模板匹配的方式在图像已编码区域中搜索与当前待预测图像块最相似的m个图像块;(2)将每个模板搜索到的最相似的m个图像块重新排列,构造一个低秩的观测矩阵;(3)对N个不同预测模式得到的观测矩阵分别进行低秩矩阵填充,重建观测矩阵中的未知元素值,得到N个当前图像块预测值;(4)使用H.264中标准帧内预测方法对当前待预测图像块进行帧内预测;(5)从步骤(3)得到的预测值与步骤(4)得到的预测值中,采用率失真优化选择一个最优预测值;即从N+1个预测值中选择一个最优预测值。本发明能更有效地利用图像中的空间相关性。

    帧内预测方法
    98.
    发明授权

    公开(公告)号:CN100586184C

    公开(公告)日:2010-01-27

    申请号:CN200810056776.X

    申请日:2008-01-24

    Abstract: 本发明涉及一种帧内预测方法。该帧内预测方法包括选取一个待预测的4×4像素亮度块作为当前块;判断所述当前块是否为中心块,若是,计算所有预测模式下所述当前块的预测块和所述当前块的残差的能量函数,并根据不同预测模式下的能量函数确定候选预测模式,否则,将可用的预测模式作为候选预测模式;计算候选预测模式的率失真代价参数,选取率失真代价参数最小的候选预测模式为所述当前块的最优预测模式。本发明根据残差能量函数确定候选预测模式,通过计算候选预测模式的率失真代价参数确定最优预测模式,达到减少需要计算率失真代价参数的预测模式的数量,进而减小计算量的目的。

Patent Agency Ranking