检测手部动作的方法和装置

    公开(公告)号:CN112733577A

    公开(公告)日:2021-04-30

    申请号:CN201911030310.7

    申请日:2019-10-28

    Inventor: 李斐 杨静 刘汝杰

    Abstract: 公开了检测手部动作的方法和装置。该方法包括:在视频的一个帧图像中识别包含人的手部的区域;将所述区域划分为多个块,并且针对每个块计算运动矢量;将得到的多个运动矢量聚类为第一聚类和第二聚类,其中对应于第一聚类的运动矢量的多个第一块对应于左手和右手中的一个,并且对应于第二聚类的运动矢量的多个第二块对应于左手和右手中的另一个;识别第一聚类和第二聚类所对应的手在所述一个帧图像之后的帧图像中的运动;通过将所识别的运动与预定动作模式进行匹配,来确定手部的动作。

    图像处理方法以及信息处理设备

    公开(公告)号:CN111340932A

    公开(公告)日:2020-06-26

    申请号:CN201811549825.3

    申请日:2018-12-18

    Inventor: 郭松 李斐

    Abstract: 提供了图像处理方法以及信息处理设备。信息处理设备可以包括处理器,该处理器可以被配置为:基于二维图像中的面部对象,构建三维面部模型;确定所构造的三维面部模型与二维图像中的面部对象之间的对应关系;基于所述对应关系,利用三维面部模型中的关键点附近的关注区域来确定二维图像中对应关键点的关注区域,并且从所确定的二维图像的关注区域中提取图像特征,作为对应关键点的图像特征。

    信息处理方法以及信息处理设备

    公开(公告)号:CN111340056A

    公开(公告)日:2020-06-26

    申请号:CN201811553508.9

    申请日:2018-12-18

    Inventor: 李斐 田虎

    Abstract: 提供了信息处理方法以及信息处理设备。信息处理设备能够被用于检测包含重复模式的图像文件中的异常,并且包括处理器,该处理器被配置为:利用预先训练好的自编码器对作为检测目标的图像文件的当前区域编码,以获得当前区域的隐藏变量;从图像文件中获取当前区域的相似区域,并利用自编码器对每个相似区域编码而获取每个相似区域的隐藏变量;基于所获取的相似区域的隐藏变量修改当前区域的隐藏变量;利用自编码器对修改后的隐藏变量解码,以获得当前区域的重构区域;以及比较当前区域与重构区域,并基于比较结果判断当前区域是否存在异常。

    用于训练深度神经网络的方法和装置

    公开(公告)号:CN110766152A

    公开(公告)日:2020-02-07

    申请号:CN201810844262.4

    申请日:2018-07-27

    Inventor: 李斐 田虎

    Abstract: 本公开涉及一种用于训练深度神经网络的方法和装置。根据本公开的一个实施例,该方法包括以下步骤:针对训练集中的每个训练样本图像,使用深度神经网络根据训练样本图像生成相应的估计深度图;基于训练样本图像的训练样本深度图和估计深度图计算训练样本图像的损失;以及基于所计算的损失优化神经网络的参数,其中,损失包括基于训练样本深度图中的至少一个平面区域和估计深度图中的对应区域的对比计算的损失项。使用该方法和装置得到的训练后的深度神经网络能够在使用单幅输入图像的情况下,提高估计深度图的准确度。

    对深度图像进行优化的方法和装置

    公开(公告)号:CN109559271A

    公开(公告)日:2019-04-02

    申请号:CN201710883474.9

    申请日:2017-09-26

    Inventor: 杜云凡 李斐

    Abstract: 本发明涉及对深度图像进行优化的方法和装置。该对深度图像进行优化的方法包括:输入步骤,输入关于一个场景的多个彩色图像以及对应的深度图像;相机姿态估计步骤,基于输入的深度图像来估计相机姿态作为初始相机姿态;相机姿态优化步骤,基于多个彩色图像对所述初始相机姿态进行优化来获得优化的相机姿态;三维模型构建步骤,基于多个彩色图像和所获得的优化的相机姿态来构建三维模型;投影步骤,基于优化的相机姿态,将所构建的三维模型投影到二维坐标空间来生成每个彩色图像对应的投影深度图像;以及深度图像优化步骤,将所生成的投影深度图像和对应的输入的深度图像进行融合得到优化的深度图像。根据本发明的方法可以得到更精确的深度图像。

    多视点图像的深度估计方法和深度估计设备

    公开(公告)号:CN108510536A

    公开(公告)日:2018-09-07

    申请号:CN201710111586.2

    申请日:2017-02-28

    Inventor: 田虎 李斐

    Abstract: 本发明公开了一种多视点图像的深度估计方法和深度估计设备。该方法包括:将同一场景的多个图像中的每个图像作为当前图像执行如下处理:获得当前图像中每个像素的初始深度值;将当前图像划分为多个超像素;基于所述初始深度值,根据预定约束条件,得到多个超像素的平面参数;以及基于超像素的平面参数,生成超像素中每个像素的深度值;其中,所述预定约束条件包括:共连接约束,所述共连接约束与彼此不遮挡的相邻超像素上的临近点的深度值差异有关。

    几何重建对象的方法和设备

    公开(公告)号:CN107680073A

    公开(公告)日:2018-02-09

    申请号:CN201610625520.0

    申请日:2016-08-02

    CPC classification number: G06T7/00 G06T17/00

    Abstract: 本发明公开一种几何重建对象的方法和设备。该方法包括:根据深度图和对应的颜色图,估计相机姿态;基于相机姿态,根据深度图,获得三维空间中体素的截断有向距离函数TSDF值;以及根据TSDF值,几何重建对象;其中,通过解最优化问题来根据深度图和对应的颜色图,估计相机姿态;代价函数与以下有关:通过所要估计的相机姿态调整后的当前帧的相机坐标空间中的三维点与前面所有帧的全局坐标空间中的对应三维点的距离的平方和、通过所要估计的相机姿态调整后的前面所有帧的全局坐标空间中的三维点在当前帧对应颜色图上的颜色与前面所有帧的全局坐标空间中的对应颜色的距离度量的平方和、及三维点在深度图或彩色图中的像素位置所经历的非刚性变换。

    三维重建对象的方法和设备

    公开(公告)号:CN106548466A

    公开(公告)日:2017-03-29

    申请号:CN201510591091.5

    申请日:2015-09-16

    Inventor: 李斐 刘汝杰

    Abstract: 本发明公开了一种三维重建对象的方法和设备。该三维重建对象的方法包括:获得三维空间中体素的初始局部截断有向距离函数TSDF值;求解最优化问题,以得到体素的一个全局TSDF值;以及基于所得到的全局TSDF值,三维重建所述对象;其中,在所述最优化问题中,一个体素的全局TSDF值基于该体素的最终局部TSDF值得到,一个体素的最终局部TSDF值等于该体素经刚性变换对应的体素的初始局部TSDF值,变量是体素的全局TSDF值和刚性变换的参数,代价函数与下列因素相关:体素的全局TSDF值与该体素经刚性变换对应的体素的初始局部TSDF值的差的平方和。

    在视频中检测摄像机运动类型的方法及装置

    公开(公告)号:CN104135658B

    公开(公告)日:2016-05-04

    申请号:CN201410273270.X

    申请日:2011-03-31

    Abstract: 本发明实施例公开了在视频中检测摄像机运动类型的方法及装置,其中一种方法包括:获取所述视频中的变焦运动参数;根据所述变焦运动参数检测出所述视频中包含的摄像机运动类型为聚焦的视频片段;计算该视频片段中各帧图像的焦点位置;以及根据所述各帧图像的焦点位置,对该视频片段的检测结果进行验证。通过本发明实施例,能够更有效、准确地检测出视频中摄像机的运动类型。

    图像处理装置、图像处理方法以及设备

    公开(公告)号:CN103310221B

    公开(公告)日:2016-04-13

    申请号:CN201210071428.6

    申请日:2012-03-16

    Abstract: 本发明提供了图像处理装置、图像处理方法以及设备,以至少克服现有的监督式及半监督式图像处理技术存在的图像处理效果差的问题。图像处理装置包括:进行图像分割的图像分割单元;提取图像级和区域级视觉特征的特征提取单元;构建图像级和区域级加权图的加权图建立单元;构造代价函数的函数构造单元;通过求解代价函数的最优问题获得图像的软标签和区域的软标签的计算单元;以及根据上述软标签来进行图像处理的图像处理单元。图像处理方法用于执行能够实现上述图像处理装置的功能的处理。上述设备包括上述图像处理装置。应用本发明的上述技术,能够获得较好的图像处理效果,可以应用于图像处理领域。

Patent Agency Ranking