-
公开(公告)号:CN114913338B
公开(公告)日:2024-06-14
申请号:CN202210407639.6
申请日:2022-04-19
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例提供了一种分割模型的训练方法及装置,图像识别方法及装置。该分割模型包括:第一网络模型、第二网络模型以及第三网络模型。训练方法包括:获取样本图像对;样本图像对中包括对同一视觉范围拍摄后得到的RGB图像以及深度图像;将深度图像输入第一网络模型,得到第一深度特征提取结果;将深度图像与RGB图像的组合图像输入第二网络模型,得到目标对象的边缘特征;将目标对象的边缘特征以及第一深度特征提取结果输入第三网络模型,得到目标对象的分割结果;根据标签以及该目标对象的分割结果,对第一网络模型、第二网络模型以及第三网络模型进行参数调整。本说明书实施例能够更为准确地得到目标对象的分割信息。
-
公开(公告)号:CN114882550A
公开(公告)日:2022-08-09
申请号:CN202210391081.7
申请日:2022-04-14
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例公开了一种人脸注册留底方法、装置以及设备。方案包括:获取用户人脸的3D人脸图,并根据3D人脸图,确定用户人脸的3D人脸点云;根据3D人脸点云,通过预先训练的拟合参数预测模型,对进行3D人脸重建时所需的拟合参数进行预测;根据拟合参数,对预设的3D参考人脸网格进行拟合处理,得到对应用户的3D参数化人脸数据,作为第一参数化数据;若之前已有用户的3D参数化人脸数据注册留底,则将已注册留底的用户的3D参数化人脸数据作为第二参数化数据,并确定第二参数化数据的时间戳;根据第一参数化数据、第二参数化数据,以及第二参数化数据的时间戳,生成第三参数化数据,作为用户注册留底的人脸数据。
-
公开(公告)号:CN114820752A
公开(公告)日:2022-07-29
申请号:CN202210282978.6
申请日:2022-03-22
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书提供的深度估计方法和系统,获取目标物体的异质双目图像,对所述异质双目图像进行跨域迁移处理生成同质双目图像,将所述同质双目图像输入深度估计网络模型,能够准确地获取所述深度估计网络模型输出的所述目标物体的深度图,而且不依赖3D摄像头,达到了降本增效的效果。
-
公开(公告)号:CN114491444A
公开(公告)日:2022-05-13
申请号:CN202210068377.5
申请日:2022-01-20
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例提供了一种身份识别方法、装置及设备,所述方法包括:基于信号发送设备在身份识别周期内的发射信号和接收信号,生成包含点云数据的目标时序数据,所述点云数据由所述发射信号和接收信号确定;基于所述目标时序数据,从所述目标时序数据中包含的点云数据中确定待识别的目标用户对应的目标点云数据,并根据所述目标点云数据,生成与所述目标用户对应的空间特征数据;基于所述空间特征数据,对所述目标用户进行身份识别,得到身份识别结果。
-
公开(公告)号:CN113298060A
公开(公告)日:2021-08-24
申请号:CN202110849620.2
申请日:2021-07-27
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例提供一种保护隐私的生物特征识别方法和装置。该方法的一具体实施方式包括:首先,获取无透镜成像设备针对生物特征采集的原始图像,其中,无透镜成像设备包括掩模板和图像传感器,原始图像是通过掩模板调制后由图像传感器采集到的图像。其次,基于掩模板的调制参数对原始图像进行重构,得到重构图像。然后,使用预先训练的特征提取网络对重构图像进行特征提取,得到重构图像的特征表示。最后,基于特征表示,对重构图像进行生物特征识别。
-
公开(公告)号:CN111161397A
公开(公告)日:2020-05-15
申请号:CN201911215540.0
申请日:2019-12-02
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例公开了一种人脸三维重建方法,获取多帧人脸图像,针对所述多帧人脸图像中的每帧人脸图像,将该帧人脸图像的二维关键点集进行三维映射,并根据三维映射得到的三维关键点集进行采样,得到该帧人脸图像的三维采样点集;从所述多帧人脸图像中选取一帧人脸图像作为目标人脸图像,针对剩余帧人脸图像中的每帧人脸图像,根据该帧人脸图像的三维采样点集和所述目标人脸图像的目标三维人脸数据进行坐标转换,并对坐标转换后的三维采样点集进行配准,得到该帧人脸图像的配准数据;根据每帧人脸图像的配准数据和所述目标人脸图像的三维关键点集进行三维重建,得到重建三维人脸图像。
-
公开(公告)号:CN119988660A
公开(公告)日:2025-05-13
申请号:CN202510436153.9
申请日:2025-04-08
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/532 , G06F16/535 , G06F16/587 , G06F16/55 , G06F16/583 , G06F40/284 , G06F40/30 , G06V10/82 , G06N3/045
Abstract: 本说明书实施例提供了一种基于大语言模型的推荐方法及装置,该方法包括:获取用户查询的至少一个主体,所述至少一个主体从目标图像中识别得到;获取所述用户的第一信息,所述第一信息用于指示所述用户的兴趣倾向;基于所述第一信息,确定所述至少一个主体中的目标主体;通过所述大语言模型,基于所述目标主体,生成对所述用户的至少一项推荐内容。
-
公开(公告)号:CN119360361A
公开(公告)日:2025-01-24
申请号:CN202411353935.8
申请日:2024-09-26
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06V20/62 , G06V30/18 , G06F16/583 , G06F16/58
Abstract: 本说明书提供了一种物品识别方法、装置、存储介质和电子设备该方法包括:获取物品包装物对应的图像数据,识别所述图像数据中的文本数据,对所述文本数据进行特征编码,以得到所述文本数据对应的语言描述文本特征,获取所述图像数据的视觉特征,基于所述视觉特征生成所述图像数据的图像描述文本特征,基于所述语言描述文本特征和所述图像描述文本特征确定所述物品包装物对应的物品标识,获取所述物品标识对应的物品识别数据。该方法提高了物品识别的便利性和准确性。
-
公开(公告)号:CN115984943B
公开(公告)日:2024-05-14
申请号:CN202310088843.0
申请日:2023-01-16
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06V40/16 , G06V10/82 , G06N3/049 , G06N3/08 , G06N3/0464
Abstract: 本说明书实施例公开了一种面部表情捕捉及模型训练方法、装置、设备、介质及产品。其中,上述面部表情捕捉方法包括:获取目标面部视频数据,目标面部视频数据包括连续多帧目标面部图像;提取目标面部视频数据对应的第一目标参数序列,第一目标参数序列包括多帧目标面部图像各自对应的第一目标参数,第一目标参数包括第一目标表情参数和第一目标旋转平移参数;利用目标时序神经网络模型优化第一目标参数序列,得到第二目标参数序列,第二目标参数序列包括第二目标表情参数序列和第二目标旋转平移参数序列,目标时序神经网络模型基于多个已知面部特征点序列的面部视频数据进行训练得到。
-
公开(公告)号:CN117809084A
公开(公告)日:2024-04-02
申请号:CN202311728963.9
申请日:2023-12-14
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06V10/764 , G06V10/774 , G06V10/80 , G06V10/82 , G06N3/0464 , G06N3/084
Abstract: 本说明书一个或多个实施例提供了一种图像识别模型训练方法、基于图像识别的交互方法及装置。该方法及装置,以相同场景下多个不同视角的采样图像为样本,通过不同视角的样本图像对比训练,得到可以对任意视角下的图像进行准确识别的目标识别模型;模型训练过程中,还结合知识蒸馏训练原理,先训练得到具有高识别精度的教师模型,再通过该教师模型指导轻量化的学生模型进行多视角对比学习,得到鲁棒的支持端侧部署的小规模的目标识别模型。另外,利用训练好的目标识别模型,对实时获取的实景图像进行识别,若识别成功则执行预设的交互动作。
-
-
-
-
-
-
-
-
-