-
公开(公告)号:CN114692892A
公开(公告)日:2022-07-01
申请号:CN202210285951.2
申请日:2022-03-23
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例描述了对数值特征进行处理的方法、模型训练方法和装置。根据实施例的方法,考虑对数值特征进行二进制编码,然后根据得到的二进制数值特征中的值可以确定出特征矩阵。如此实现了对数值特征可能值都进行了编码,能够降低特征信息损失的可能。进一步,对得到的特征矩阵进行数据域覆盖,能够使得利用该数值特征训练得到的模型在预测应用时,对未参与模型训练的数值输入值也能具有较好的输出。
-
公开(公告)号:CN112149824A
公开(公告)日:2020-12-29
申请号:CN202010968311.2
申请日:2020-09-15
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例提供一种更新推荐模型的方法和装置,其中推荐模型包括通过强化学习实现的智能体。方法包括:获取针对目标用户的当前推荐状态,将其输入智能体,智能体根据推荐策略,从备选动作集中确定针对目标用户的推荐动作。其中,推荐策略通过策略参数进行表征。然后,确定在执行上述推荐动作的情况下,按照推荐策略进行推荐的期望收益,作为第一收益;确定在推荐策略下,执行所有备选动作的预期平均收益,作为第二收益;并且,基于第一收益与第二收益的差值,确定执行推荐动作的遗憾度表示。根据上述遗憾度表示,确定对策略参数的更新梯度;于是根据更新梯度,更新智能体中的推荐策略。
-
公开(公告)号:CN115293238A
公开(公告)日:2022-11-04
申请号:CN202210793703.9
申请日:2022-07-07
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例提供了一种可信性判别的方法及系统。其中方法包括:获取表征模型分别利用第一主体和第二主体在时间t2之前预设时长内的行为特征得到的第一主体和第二主体的表征向量;针对所述第一主体确定与该第一主体的表征向量之间的距离满足预设第一条件的第二主体,并将确定出的各第二主体分别与第一主体构成候选关系对;对各候选关系对进行风险评分,选择风险评分满足预设第二条件的候选关系对作为可信关系对,所述可信关系对用以在时间t2+m对包含网络行为的流量进行可信性判别。本申请能够实现基于双主体的准确可信性判别。
-
公开(公告)号:CN114912549A
公开(公告)日:2022-08-16
申请号:CN202210807503.4
申请日:2022-07-11
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例描述了风险交易识别模型的训练方法、风险交易识别方法和装置。根据实施例的方法,在对风险交易识别模型进行训练时,获取到的黑数据样本和白数据样本的分类标签是已知的。通过利用当前训练的风险交易识别模型对各数据样本进行识别能够得到各自的识别结果,进而可以确定出损失函数,并利用该损失函数继续进行模型训练。由于确定的损失函数是能够提高黑数据样本的学习权重的,从而当用于模型学习的黑数据样本少于白数据样本时,能够减弱学习任务向白数据样本的分类标签倾斜的问题,进而提高模型对风险交易进行识别的准确性。
-
公开(公告)号:CN114897168A
公开(公告)日:2022-08-12
申请号:CN202210696228.3
申请日:2022-06-20
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本公开提供了一种风控模型的融合训练方法,包括:接收标签数据并提炼专家知识;将所述标签数据和所述专家知识分别进行多阶特征交叉以获取数据表征和规则表征;基于所述规则表征提纯所述数据表征;以及基于经提纯的数据表征训练并输出所述风控模型。
-
公开(公告)号:CN113988225B
公开(公告)日:2022-05-06
申请号:CN202111597741.9
申请日:2021-12-24
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例提供了一种建立表征提取模型、表征提取、类型识别的方法和装置。根据该实施例的方法,首先获取包含一个以上样本对的第一训练数据,样本对包括正样本对和负样本对;然后利用第一训练数据训练第一表征提取模型和第二表征提取模型,其中第一表征提取模型用以利用用户的终端侧特征提取用户的终端侧表征向量,第二表征提取模型用以利用用户的服务器侧特征提取用户的服务器侧表征向量;训练目标为最大化正样本对的终端侧表征向量与服务器侧表征向量之间的相似度且最小化负样本对的终端侧表征向量与服务器侧表征向量之间的相似度;再将训练得到的第一表征提取模型部署于终端设备。
-
公开(公告)号:CN114897168B
公开(公告)日:2025-02-18
申请号:CN202210696228.3
申请日:2022-06-20
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本公开提供了一种风控模型的融合训练方法,包括:接收标签数据并提炼专家知识;将所述标签数据和所述专家知识分别进行多阶特征交叉以获取数据表征和规则表征;基于所述规则表征提纯所述数据表征;以及基于经提纯的数据表征训练并输出所述风控模型。
-
公开(公告)号:CN118627569A
公开(公告)日:2024-09-10
申请号:CN202410735484.8
申请日:2024-06-05
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06N3/08 , G06Q20/40 , G06F18/24 , G06F18/213 , G06N3/0464
Abstract: 本说明书提供的一种模型训练方法、业务风控方法、装置以及存储介质,可以首先获取第一样本交易数据以及其对应的实际风险层级标签,并将第一样本交易数据输入到过渡模型中包含的特征提取层中,以提取出交易特征,并将交易特征输入到过渡模型中包含的分类层中,以确定出预测风险层级标签,以最小化预测风险层级标签与实际风险层级标签之间的偏差为优化目标,至少对特征提取层进行训练,通过训练后的特征提取层以及预设的各目标分类层,构建目标模型,并将第二样本交易数据输入到目标模型中,以通过目标模型确定出预测风险识别结果,以最小化预测风险识别结果与第二样本交易数据对应的实际风险识别结果之间的偏差为优化目标,对目标模型进行训练。
-
公开(公告)号:CN114462502B
公开(公告)日:2024-07-12
申请号:CN202210011293.8
申请日:2022-01-06
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F18/214 , G06F18/22 , G06F18/241 , G06F21/62
Abstract: 本说明书公开了一种核身推荐模型训练方法及装置。所述方法包括:获取训练样本集合;所述训练样本集合包括不同业务场景中标注有核身产品推荐标签的训练样本;根据所述训练样本集合,预训练所述表征模型;预训练后的表征模型用于将输入的样本特征映射到第一向量空间中,针对相同推荐标签的样本减小第一向量空间映射结果之间的距离;获取任一业务场景中的若干训练样本,将所获取的训练样本输入所述预训练后的表征模型得到第一向量空间映射结果,根据所获取训练样本的第一向量空间映射结果和核身产品推荐标签,训练该业务场景对应的预测模型。
-
公开(公告)号:CN117743856A
公开(公告)日:2024-03-22
申请号:CN202311845208.9
申请日:2023-12-28
Applicant: 清华大学 , 支付宝(杭州)信息技术有限公司
IPC: G06F18/214 , G06F18/2415 , G06F18/243 , G06N20/00 , G06Q20/40
Abstract: 本说明书实施例涉及一种训练风险识别模型的方法及装置,方法包括:首先,获取有硬标签的第一样本集,以及无标签的第二样本集,任一样本集包括交易样本,硬标签指示交易是否为风险交易。然后,基于插值法对第一样本集进行样本增强,并使用增强后的第一样本集训练得到第一模型。接下来,将第一样本集和第二样本集构成的样本总集中的各个交易样本输入到第一模型中,得到关于风险预测的软标签。最后,将第一样本集中的交易样本输入到第二模型中,基于硬标签确定第一损失;将样本总集中的交易样本输入到第二模型中,基于软标签确定第二损失;基于第一损失和第二损失所确定的总预测损失,对第二模型进行训练,第二模型用于预测交易是否为风险交易。
-
-
-
-
-
-
-
-
-