-
公开(公告)号:CN114692892B
公开(公告)日:2023-08-29
申请号:CN202210285951.2
申请日:2022-03-23
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例描述了对数值特征进行处理的方法、模型训练方法和装置。根据实施例的方法,考虑对数值特征进行二进制编码,然后根据得到的二进制数值特征中的值可以确定出特征矩阵。如此实现了对数值特征可能值都进行了编码,能够降低特征信息损失的可能。进一步,对得到的特征矩阵进行数据域覆盖,能够使得利用该数值特征训练得到的模型在预测应用时,对未参与模型训练的数值输入值也能具有较好的输出。
-
公开(公告)号:CN115905876A
公开(公告)日:2023-04-04
申请号:CN202211725485.1
申请日:2022-12-30
Applicant: 支付宝(杭州)信息技术有限公司
Inventor: 刘芳卿
IPC: G06F18/214 , G06N3/0464 , G06N3/048 , G06N3/084 , G06Q20/40 , G06F18/24 , G06N3/006 , G06N3/126
Abstract: 本说明书实施例公开了一种模型的处理方法、装置及设备,该方法包括:基于第一样本数据和第一样本数据对应的标注标签信息对标签还原模型进行模型训练,得到训练后的标签还原模型,所述标注标签信息是预先为样本数据进行标注处理后得到的标签信息,所述标签还原模型用于为样本数据生成相应的标签信息;基于所述训练后的标签还原模型分别为所述第一样本数据和第二样本数据生成相应的还原标签信息,所述第二样本数据为不包含相应的标注标签信息或标注标签信息异常的样本数据;基于所述第一样本数据和第二样本数据,以及生成的相应的还原标签信息对应用于目标业务的目标模型进行模型训练,得到训练后的目标模型。
-
公开(公告)号:CN117743824A
公开(公告)日:2024-03-22
申请号:CN202311715695.7
申请日:2023-12-13
Applicant: 支付宝(杭州)信息技术有限公司
Inventor: 刘芳卿
IPC: G06F18/213 , G06F18/214 , G06F18/24
Abstract: 本说明书公开一种模型训练、业务执行方法、装置、存储介质及设备,服务器可以通过两阶段训练,得到第二特征提取模型,从而可以通过第二特征提取模型对第一特征提取模型输出的结构化特征表示进行调整,以减小第一特征提取模型输出的结构化特征表示和文本生成模型所需的文本数据对应的文本特征表示之间的差异,从而可以提升通过文本生成模型进行业务执行的结果的准确性。
-
公开(公告)号:CN116629883A
公开(公告)日:2023-08-22
申请号:CN202310617488.1
申请日:2023-05-26
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例提供了一种多场景风险识别方法及装置、介质、设备。方法包括:根据用户交易特征向量,确定对应的路由分配概率向量;其中,所述路由分配概率向量包括N个路由分配概率,N为大于1的正整数;将所述用户交易特征向量在N个业务场景中分别进行表征映射,得到N个表征向量;其中,N个业务场景、N个路由分配概率和N个表征向量一一对应;根据所述路由分配概率向量和所述N个表征向量中的至少一个表征向量,确定融合向量;根据所述融合向量,确定所述用户交易特征向量的风险识别结果。本发明可以降低成本,提高安全风险识别的准确性。
-
公开(公告)号:CN115828162B
公开(公告)日:2023-07-07
申请号:CN202310137411.4
申请日:2023-02-08
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F18/241 , G06F18/214 , G06F18/25
Abstract: 本说明书公开了一种分类模型训练的方法、装置、存储介质及电子设备,在本说明书提供的方法中,先获得每种模态类型的信息的单模态分类结果,作为第一分类结果,然后将各模态类型的信息输入待训练的多模态分类模型,确定各模态类型的信息的特征与各特征的融合特征,并根据融合特征确定所述训练样本的分类结果,作为第二结果,根据所述第一分类结果、第二分类结果、所述标注确定各模态类型对应的损失,根据各模态类型对应的损失确定共同损失,根据共同结果调整待训练的多模态分类模型的参数,得到训练后的多模态分类模型。从上述方法中可以看出,根据本方法训练得到的多模态分类模型能够准确的根据多模态类型的信息进行分类。
-
公开(公告)号:CN114692892A
公开(公告)日:2022-07-01
申请号:CN202210285951.2
申请日:2022-03-23
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例描述了对数值特征进行处理的方法、模型训练方法和装置。根据实施例的方法,考虑对数值特征进行二进制编码,然后根据得到的二进制数值特征中的值可以确定出特征矩阵。如此实现了对数值特征可能值都进行了编码,能够降低特征信息损失的可能。进一步,对得到的特征矩阵进行数据域覆盖,能够使得利用该数值特征训练得到的模型在预测应用时,对未参与模型训练的数值输入值也能具有较好的输出。
-
公开(公告)号:CN118278421A
公开(公告)日:2024-07-02
申请号:CN202410471724.8
申请日:2024-04-18
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F40/35 , G06F16/332 , G06F16/335 , G06F16/35 , G06F18/22
Abstract: 本说明书公开了一种任务执行方法、装置、电子设备及存储介质,可以通过大语言模型基于用户输入的问题文本数据中包含的一部分文本的语义,预测用户输入的问题文本中的另一部分文本的内容,即,预测文本数据,进而可以根据大语言模型预测的预测文本数据所表达的文本内容和用户实际输入的另一部分文本内容进行匹配,若大语言模型预测的预测文本数据所表达的文本内容和用户实际输入的另一部分文本内容不一致,则可以确定用户输入的问题文本数据可能存在风险,此时,大语言模型可以按照预设的风险答复策略生成回复文本数据,进而可以提升大语言模型生成的回复文本数据的安全性。
-
公开(公告)号:CN114692724B
公开(公告)日:2023-03-28
申请号:CN202210208136.6
申请日:2022-03-03
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F18/2415 , G06F18/214 , G06N3/047 , G06N3/08
Abstract: 本说明书实施例描述了数据分类模型的训练方法、数据分类方法和装置。根据实施例的方法,首先获取标签已知的正数据样本和标签未知的灰度数据样本,然后分别确定基于该正数据样本的标准正数据概率分布和基于该灰度数据样本的拟合正数据概率分布。进一步即可根据该标准正数据概率分布和拟合正数据概率分布实现对数据分类模型的训练。如此基于灰度数据中的正数据也应服从标准正数据概率分布的原则,构建适用于对所有数据进行标签分类的数据分类模型,从而能够提高利用该数据分类模型对数据进行分类的准确性。
-
公开(公告)号:CN114692724A
公开(公告)日:2022-07-01
申请号:CN202210208136.6
申请日:2022-03-03
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例描述了数据分类模型的训练方法、数据分类方法和装置。根据实施例的方法,首先获取标签已知的正数据样本和标签未知的灰度数据样本,然后分别确定基于该正数据样本的标准正数据概率分布和基于该灰度数据样本的拟合正数据概率分布。进一步即可根据该标准正数据概率分布和拟合正数据概率分布实现对数据分类模型的训练。如此基于灰度数据中的正数据也应服从标准正数据概率分布的原则,构建适用于对所有数据进行标签分类的数据分类模型,从而能够提高利用该数据分类模型对数据进行分类的准确性。
-
公开(公告)号:CN114897168B
公开(公告)日:2025-02-18
申请号:CN202210696228.3
申请日:2022-06-20
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本公开提供了一种风控模型的融合训练方法,包括:接收标签数据并提炼专家知识;将所述标签数据和所述专家知识分别进行多阶特征交叉以获取数据表征和规则表征;基于所述规则表征提纯所述数据表征;以及基于经提纯的数据表征训练并输出所述风控模型。
-
-
-
-
-
-
-
-
-