图像处理方法以及装置
    1.
    发明公开

    公开(公告)号:CN112258565A

    公开(公告)日:2021-01-22

    申请号:CN201910663308.7

    申请日:2019-07-22

    Abstract: 本申请公开了人工智能领域中计算机视觉领域的一种图像处理方法及装置。其中,该图像处理方法,包括:获取待处理图像;根据目标单目深度估计网络对待处理图像进行深度预测处理,得到待处理图像的目标深度图像,该目标单目深度估计网络的参数是根据该目标单目深度估计网络对样本图像进行深度预测处理的图像损失确定的,该图像损失包括法向损失值,法向损失值是根据第一法向向量与第二法向向量之间的差异确定的;基于目标深度图像,预测待处理图像的深度值。本申请的技术方案能够提高单目深度估计网络预测图像深度的准确性。

    深度及置信度估计系统
    2.
    发明授权

    公开(公告)号:CN112488104B

    公开(公告)日:2024-04-09

    申请号:CN202011377446.8

    申请日:2020-11-30

    Abstract: 本申请涉及一种人工智能领域中用于深度估计和置信度预测的机器学习模型的训练方法。所述方法包括:获取带有真实深度标签的训练图像;将所述训练图像输入到待训练的机器学习模型得到深度估计多类别概率;根据所述深度估计多类别概率,分别生成所述训练图像的各个像素点的深度估计值和置信度;根据损失函数调整所述待训练的机器学习模型的模型参数,直到所述损失函数的输出满足预设优化条件,得到训练好的机器学习模型。

    一种增强现实方法及其相关设备
    3.
    发明公开

    公开(公告)号:CN113066125A

    公开(公告)日:2021-07-02

    申请号:CN202110221723.4

    申请日:2021-02-27

    Abstract: 本申请提供一种增强现实方法及其相关装置,能够将虚拟物体的朝向与真实物体的朝向动态关联,使得目标图像中呈现的真实物体和虚拟物体结合更加逼真,提高用户体验。本申请的方法包括:获取相机拍摄的目标图像,和第一物体在目标图像中的第一位置信息;获取第二物体在相机对应的三维坐标系中的第二位置信息,和第三物体在三维坐标系中的第三位置信息,第二物体为第一物体的参照物;根据第一位置信息和第二位置信息,获取第一物体相对于第二物体的位姿变化量;根据位姿变化量对第三位置信息进行变换,以得到第三物体在三维坐标系中的第四位置信息;根据第四位置信息在目标图像中渲染第三物体,以得到新的目标图像。

    一种动作生成方法、训练方法以及装置

    公开(公告)号:CN117115314A

    公开(公告)日:2023-11-24

    申请号:CN202310626596.5

    申请日:2023-05-30

    Abstract: 本申请提供一种动作生成方法、训练方法以及装置,用于在计算机视觉领域生成更符合运动规律的动作,从而提高用户对于数字人的表述观感。包括:首先,获取输入运动数据,输入运动数据包括表示数字人进行运动的多个动作的数据;随后,从输入运动数据中的多种维度提取特征,得到运动特征,该多种维度可以包括时间维度与空间维度,从而提取到可以描述多个动作的时空关联性的特征;随后生成动作根据运动特征得到输出运动数据,输出运动数据包括表示数字人进行运动的多个动作以及至少一个生成动作的数据。

    深度及置信度估计系统
    5.
    发明公开

    公开(公告)号:CN112488104A

    公开(公告)日:2021-03-12

    申请号:CN202011377446.8

    申请日:2020-11-30

    Abstract: 本申请涉及一种人工智能领域中用于深度估计和置信度预测的机器学习模型的训练方法。所述方法包括:获取带有真实深度标签的训练图像;将所述训练图像输入到待训练的机器学习模型得到深度估计多类别概率;根据所述深度估计多类别概率,分别生成所述训练图像的各个像素点的深度估计值和置信度;根据损失函数调整所述待训练的机器学习模型的模型参数,直到所述损失函数的输出满足预设优化条件,得到训练好的机器学习模型。

    一种动作生成方法以及装置

    公开(公告)号:CN113792537B

    公开(公告)日:2025-03-18

    申请号:CN202110925419.8

    申请日:2021-08-12

    Abstract: 本申请公开了人工智能领域的一种动作生成方法以及装置,该方法可以包括:获取输入语料,输入语料包括至少一个词;根据输入语料获取词序列,词序列中包括与至少一个词对应的向量;获取动作序列,动作序列中包括至少一个动作对应的向量,至少一个动作包括与至少一个词对应的动作;融合词序列和动作序列,得到融合序列;将融合序列作为动作生成网络的输入,输出参数集合,参数集合中包括动作参数,该动作参数用于渲染得到包括了动作的图像。

    对象控制方法、装置及计算机存储介质

    公开(公告)号:CN116795265A

    公开(公告)日:2023-09-22

    申请号:CN202310541264.7

    申请日:2023-05-12

    Abstract: 本申请提供了一种对象控制方法、装置及计算机存储介质。在实施例中方法包括:确定可控对象对应的第一参考表征向量;第一参考表征向量包括第一文本对应的文本表征向量和/或语音表征向量;对第一参考表征向量和信息量化数据中的参考表征向量进行匹配,确定第一动作表征向量集合;信息量化数据指示了可控对象的动作数据对应的动作表征向量和动作表征向量对应的参考表征向量;参考表征向量通过对动作数据对应的第二数据进行第一量化处理得到;第一动作表征向量集合包括匹配的参考表征向量对应的动作表征向量;基于第一动作表征向量集合和可控对象的前一动作对应的第二动作表征向量,确定目标表征向量,基于目标动作表征向量提高生成动作的质量。

    一种修复方法、装置及存储介质
    8.
    发明公开

    公开(公告)号:CN116342408A

    公开(公告)日:2023-06-27

    申请号:CN202310196583.9

    申请日:2023-02-24

    Abstract: 本申请涉及一种修复方法、装置及存储介质。其中,该方法包括:获取第一数据;所述第一数据包括三维3D人体模型的运动数据;根据3D人体模型和第一约束条件,对第一数据进行修正,得到第一修正数据;第一约束条件用于在修正过程中对语义一致性和/或运动一致性进行约束;语义一致性指3D人体模型中人体部件构成的动作语义保持一致;运动一致性包括:运动幅度的一致性、运动方向的一致性、运动速度的一致性或运动加速度的一致性中的至少一项。本申请实施例可以修正3D人体模型的运动数据,并可以保持原有动作的语义一致性、运动轨迹一致性及时序连续性,可以使修复后3D人体模型无穿模且动作自然连贯、平滑稳定。

    一种深度图像的获取方法及电子设备

    公开(公告)号:CN114445478A

    公开(公告)日:2022-05-06

    申请号:CN202011211807.1

    申请日:2020-11-03

    Abstract: 本申请实施例提供一种深度图像的获取方法及电子设备,涉及图像处理技术领域,可以解决获取的深度图像出现残缺,深度图像中目标场景的内容不完整的问题。具体方案包括:电子设备可以获取第一深度图像和第二深度图像;其中,第一深度图像为电子设备采集的目标场景的深度图像,第一深度图像包括N个像素点,第二深度图像为处理目标场景的RGB图像得到的深度图像,第二深度图像包括M个像素点,M和N均为整数,1

    一种数据处理方法及其装置
    10.
    发明公开

    公开(公告)号:CN117132686A

    公开(公告)日:2023-11-28

    申请号:CN202310996509.5

    申请日:2023-08-08

    Abstract: 一种数据处理方法,涉及人工智能领域,包括:获取第一人物的骨架姿态;根据所述骨架姿态,通过第一编码器,得到第一特征表示,所述第一特征表示包括预先设定数量的骨架节点以及每个所述骨架节点对应的特征表示;根据所述第一特征表示,通过第一解码器,得到所述骨架姿态对应的第一重建骨架姿态。本申请对不同骨架结构的特征表示到同一个骨架结构中来表达,也就是可以将不同骨架的动作投射到统一的主骨架,从而可以在训练不同骨架结构的编码器和解码器,通过其他的骨架结构的数据来进行当前骨架结构对应的模型的训练,从而提高动作生成的质量。

Patent Agency Ranking