-
公开(公告)号:CN114708871A
公开(公告)日:2022-07-05
申请号:CN202210242957.1
申请日:2022-03-11
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G10L17/04
Abstract: 本说明书提供的声纹识别模型的训练方法、系统以及声纹识别方法和系统,提出了一种区分相似说话人的方案,在声纹识别模型训练过程中,通过自适应调整与目标样本声纹特征相近的相似类别的余量取值,使得训练过程中相似类别所占的权重加大,加重训练过程中相似说话人梯度的权重,从而使网络更加关注于对相似说话人的区分,使训练得到的声纹识别模型能够准确的对相似说话人的声纹特征进行区分,提升声纹识别模型的安全性。
-
公开(公告)号:CN115222970A
公开(公告)日:2022-10-21
申请号:CN202210750396.6
申请日:2022-06-29
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06V10/74 , G06V10/774 , G06V40/12 , G06V40/16 , G06V40/18 , G06V10/82 , G06N3/08 , G10L17/04 , G10L17/18
Abstract: 本说明书实施例公开了一种开集识别方法、装置、电子设备、介质及程序产品。其中,该方法包括:获取待识别数据;将待识别数据输入开集识别模型中,基于指定目标的基准数据输出待识别数据对应的分数,分数用于表征待识别数据与基准数据之间的相似度;开集识别模型对应的损失函数用于使开集识别模型的神经网络输出的目标得分集合中多个目标得分的最小值大于神经网络输出的非目标得分集合中多个非目标得分的最大值,目标得分用于表征目标相同的数据之间的相似度,非目标得分用于表征目标不同的数据之间的相似度;在待识别数据对应的分数大于预设阈值的情况下,确定待识别数据对应的目标为指定目标。
-
公开(公告)号:CN118710752A
公开(公告)日:2024-09-27
申请号:CN202410842205.8
申请日:2024-06-26
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书一个或多个实施例提供了一种图像生成方法及装置。通过该方法,可以先基于包含目标隐藏对象的图像信息,提取目标隐藏对象的光照特征信息、阴影特征信息、深度特征信息和结构特征信息等多个视觉特征信息;然后,在生成图像过程中,通过这些视觉特征信息和图像描述信息,控制生成图像的内容和效果,得到隐藏有目标隐藏对象的图像。
-
公开(公告)号:CN114820752A
公开(公告)日:2022-07-29
申请号:CN202210282978.6
申请日:2022-03-22
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书提供的深度估计方法和系统,获取目标物体的异质双目图像,对所述异质双目图像进行跨域迁移处理生成同质双目图像,将所述同质双目图像输入深度估计网络模型,能够准确地获取所述深度估计网络模型输出的所述目标物体的深度图,而且不依赖3D摄像头,达到了降本增效的效果。
-
-
-