-
公开(公告)号:CN117093863A
公开(公告)日:2023-11-21
申请号:CN202311007524.9
申请日:2023-08-10
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F18/214 , G06F18/241 , G06F16/35 , G06V10/764 , G06N3/0464 , G06N3/08
Abstract: 本说明书实施例公开了一种模型的处理方法、装置及设备,该方法包括:获取用于训练目标模型的第一样本数据和第二样本数据,第一样本数据的第一标签信息的准确度高于第二样本数据的第二标签信息的准确度;基于第一样本数据、第二样本数据、目标模型对应的业务的信息、第一标签信息和第二标签信息,对预训练的样本权重模型进行模型训练,得到训练后的样本权重模型;基于第二样本数据和第二标签信息,通过训练后的样本权重模型确定第二样本数据的置信度;基于第二样本数据、第二标签信息和第二样本数据的置信度,对目标模型进行模型训练,得到训练后的目标模型。
-
公开(公告)号:CN112541530B
公开(公告)日:2023-06-20
申请号:CN202011409579.9
申请日:2020-12-06
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F18/10 , G06F18/23213 , G06N3/0464 , G06N3/0455 , G06N3/084 , G06N3/088
Abstract: 本说明书实施例提供一种针对聚类模型的数据预处理以及利用属性图进行业务实体聚类的方法,基于信息论,提供了一种通过表征向量对属性图进行表征,并利用表征向量与聚类类别的原型向量之间转移的信息损失来训练聚类模型。并且,这种信息损失通过表征向量与基于原型向量确定的映射向量之间的相似性来衡量。进一步地,在确定互信息的过程中,利用经验概率分布代替总体分布的期望,提供一种可以利用经验逼近互信息的方式。该方式得以有效利用信息论,从而提供更有效的利用属性图的业务实体聚类方法。
-
公开(公告)号:CN112541530A
公开(公告)日:2021-03-23
申请号:CN202011409579.9
申请日:2020-12-06
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例提供一种针对聚类模型的数据预处理以及利用属性图进行业务实体聚类的方法,基于信息论,提供了一种通过表征向量对属性图进行表征,并利用表征向量与聚类类别的原型向量之间转移的信息损失来训练聚类模型。并且,这种信息损失通过表征向量与基于原型向量确定的映射向量之间的相似性来衡量。进一步地,在确定互信息的过程中,利用经验概率分布代替总体分布的期望,提供一种可以利用经验逼近互信息的方式。该方式得以有效利用信息论,从而提供更有效的利用属性图的业务实体聚类方法。
-
公开(公告)号:CN111522998A
公开(公告)日:2020-08-11
申请号:CN202010297229.1
申请日:2020-04-15
Applicant: 支付宝(杭州)信息技术有限公司
Inventor: 赵文龙
IPC: G06F16/901 , G06N7/00
Abstract: 公开了一种图模型的生成方法、装置及设备。在对图模型中的点和边进行绘制时,考虑了节点的各特征的发生概率,并使用自信息量进行表征,并反映在节点权重中,以及对于节点之间共享特征的发生概率也基于自信息量进行表征,并反映在边权重中。
-
公开(公告)号:CN111402124A
公开(公告)日:2020-07-10
申请号:CN202010213843.5
申请日:2020-03-24
Applicant: 支付宝(杭州)信息技术有限公司
Inventor: 赵文龙
Abstract: 本发明实施例提供了一种计算机执行的纹理图像和合成图像的生成方法和装置,生成方法包括:对于待生成图像中任意的第一位置的坐标值施加基础图形函数,得到基础值;针对第一位置,至少根据噪声扰动函数,生成扰动噪声值;对于基础值和扰动噪声值的和值,施加调整函数,得到该第一位置的像素值;根据各个位置的像素值,生成纹理图像。使用该方法大量生成复杂、不重复且低成本的纹理图像,可用于训练图像识别模型。结合这种纹理图像和文本图像可以生成一种合成图像,并且记录合成图像中每个文本的位置信息,将其作为合成图像的文本位置标签数据。以该合成图像作为验证码训练验证码识别模型,有效提高了识别模型的识别能力。
-
-
-
-