-
公开(公告)号:CN116863043A
公开(公告)日:2023-10-10
申请号:CN202310602158.5
申请日:2023-05-25
Applicant: 度小满科技(北京)有限公司
Abstract: 本发明提供一种面部动态捕捉驱动方法、装置、电子设备及可读存储介质,包括:接收第一输入,所述第一输入包括面部形态键信息和面部绑定关键骨骼信息;响应于所述第一输入,生成面部动态捕捉驱动模型;接收第二输入,所述第二输入为若干帧包含面部特征的图像信息;响应于所述第二输入,将所述包含面部特征的图像信息导入所述面部动态捕捉驱动模型中,生成并显示面部动态捕捉驱动结果。
-
公开(公告)号:CN114821724A
公开(公告)日:2022-07-29
申请号:CN202210455469.9
申请日:2022-04-27
Applicant: 度小满科技(北京)有限公司
Abstract: 本申请公开了一种人脸识别方法、装置、终端及存储介质,方法包括:接收第一人脸图像和第二人脸图像;基于第一人脸图像、第二人脸图像和人脸解析网络模型,得到第一人脸图像对应的多个面部区域图像对和第二人脸图像对应的多个面部区域图像对;基于第一人脸图像对应的多个面部区域图像对、第二人脸图像对应的多个面部区域图像对、特征提取网络模型和映射网络模型,确定第一人脸图像对应的五官特征描述子和第二人脸图像对应的五官特征描述子;基于第一人脸图像对应的五官特征描述子、第二人脸图像对应的五官特征描述子和预设阈值,确定第一人脸图像和第二人脸图像中的人像为同一人。本发明提高了人脸识别的精度以及模型的鲁棒性。
-
公开(公告)号:CN119724221A
公开(公告)日:2025-03-28
申请号:CN202411753399.0
申请日:2024-12-02
Applicant: 度小满科技(北京)有限公司
Abstract: 本申请公开了一种基于语音的3D数字人口型驱动方法、装置、设备及介质,所述方法,包括:获取目标语音数据;将所述目标语音数据输入至目标分析模型,得到目标驱动序列数据;所述目标分析模型用于基于所述目标语音数据确定所述目标驱动序列数据,所述目标驱动序列数据对应的特征维度与3D数字人的口部特征维度对应;基于所述目标驱动序列数据,对3D数字人进行渲染驱动,能够有效提高3D数字人口型的准确性。
-
公开(公告)号:CN116175576A
公开(公告)日:2023-05-30
申请号:CN202310188531.7
申请日:2023-02-21
Applicant: 度小满科技(北京)有限公司
IPC: B25J9/16
Abstract: 本申请公开了一种数字人骨骼驱动方法、装置、计算机设备及存储介质。该方法包括:获取具有骨骼的数字人模型和参考图像帧;对参考图像帧中的目标进行关键点检测,生成关键点检测结果,关键点检测结果中包括:多个关键点在目标中的位置参数;根据参考图像帧和关键点检测结果,采用预先训练的骨骼控制参数神经网络模型输出目标的骨骼控制参数;根据骨骼控制参数对数字人模型的骨骼进行驱动,得到目标数字人模型。本申请可以准确驱动数字人,并提高数字人驱动的扩展性和通用性。
-
公开(公告)号:CN115937924A
公开(公告)日:2023-04-07
申请号:CN202211246767.3
申请日:2022-10-12
Applicant: 度小满科技(北京)有限公司
Abstract: 本申请提供了一种人脸识别方法、装置及电子设备,包括:获取第一人脸图像和第二人脸图像;对第一人脸图像和第二人脸图像分别进行人脸关键点检测,分别得到至少一个第一人脸关键点坐标和至少一个第二人脸关键点坐标;根据至少一个第一人脸关键点坐标生成第一人脸轮廓图像,根据至少一个第二人脸关键点坐标生成第二人脸轮廓图像;根据第一人脸图像、第二人脸图像、第一人脸轮廓图像、第二人脸轮廓图像,判断第一人脸图像中的人脸和第二人脸图像中的人脸是否为同一人脸。以提高对整体上较相似、五官等形状细节有差异的人脸图像的识别能力,提高人脸识别的精度。
-
公开(公告)号:CN115131368A
公开(公告)日:2022-09-30
申请号:CN202210669332.3
申请日:2022-06-14
Applicant: 度小满科技(北京)有限公司
Abstract: 本发明公开了一种图像处理方法及装置。其中,该方法包括:获取第一图像和第二图像,其中,第一图像为目标对象的非活体图像,第二图像为实时采集到的当前对象的活体图像;对第一图像进行分割处理,得到第一区域,其中,第一区域为目标对象所处的区域;基于第一区域对应的目标外接矩形对第一区域进行旋转处理,得到目标旋转角度;基于第一区域、第一图像、目标旋转角度对第二图像进行验证,得到验证结果,其中,验证结果用于确定第二图像中的当前对象是否为第一图像中的目标对象。本发明解决了相关技术中由于非人像图像区域大造成的人脸识别准确率低的技术问题。
-
公开(公告)号:CN115131368B
公开(公告)日:2025-05-02
申请号:CN202210669332.3
申请日:2022-06-14
Applicant: 度小满科技(北京)有限公司
IPC: G06T7/11 , G06T3/604 , G06T7/60 , G06N3/0464 , G06N3/045 , G06V40/16 , G06V10/24 , G06V10/25 , G06V10/74
Abstract: 本发明公开了一种图像处理方法及装置。其中,该方法包括:获取第一图像和第二图像,其中,第一图像为目标对象的非活体图像,第二图像为实时采集到的当前对象的活体图像;对第一图像进行分割处理,得到第一区域,其中,第一区域为目标对象所处的区域;基于第一区域对应的目标外接矩形对第一区域进行旋转处理,得到目标旋转角度;基于第一区域、第一图像、目标旋转角度对第二图像进行验证,得到验证结果,其中,验证结果用于确定第二图像中的当前对象是否为第一图像中的目标对象。本发明解决了相关技术中由于非人像图像区域大造成的人脸识别准确率低的技术问题。
-
公开(公告)号:CN117726724A
公开(公告)日:2024-03-19
申请号:CN202311790348.0
申请日:2023-12-22
Applicant: 度小满科技(北京)有限公司
Abstract: 本发明提供一种2D/3D口型驱动方法、装置、电子设备及可读存储介质,包括:接收第一输入,第一输入为视频帧信息中包含的语音特征;响应于第一输入,根据语音特征获得目标生物的表情系数;接收第二输入,第二输入为目标数字生物的输出类型;响应于第二输入,在目标数字生物的输出类型是3D的情况下,根据表情系数获取目标数字生物的口部形态键值,并根据口部形态键值驱动3D数字生物口型;或者,在目标数字生物的输出类型是2D的情况下,根据视频帧的渲染帧和中性帧获取数字生物的面部运动数据,根据面部运动数据驱动2D数字生物口型。本发明实现了不同应用环境下2D或者3D数字生物口型的完整驱动。
-
-
-
-
-
-
-