-
公开(公告)号:CN119046174A
公开(公告)日:2024-11-29
申请号:CN202411535888.9
申请日:2024-10-30
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F11/36 , G06F18/20 , G06V10/40 , G06F40/126 , G06N3/0455 , G06N3/08
Abstract: 本说明书公开了一种模型训练以及页面检测方法、装置、介质及设备。获取样本页面图像,样本页面图像对应的导航文本以及标签文本。将样本页面图像与导航文本输入到预设的大语言模型,以使大语言模型根据导航文本,确定输出文本,输出文本中包含有目标控件在页面中所在位置的预测坐标表征。将预测坐标表征输入到待训练的坐标解码器,得到目标控件在页面中所在位置的预测坐标。根据预测坐标与实际页面坐标之间的差异,确定综合损失值,以根据综合损失值,对坐标解码器进行训练。使得训练完成的坐标解码器能够对大语言模型输出的预测坐标表征进行纠正,提高页面检测准确性。
-
公开(公告)号:CN117592056A
公开(公告)日:2024-02-23
申请号:CN202311564982.2
申请日:2023-11-21
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F21/57 , G06N3/0475 , G06N3/0464 , G06N3/09
Abstract: 本说明书公开了一种模型的防盗取检测方法、装置、存储介质和电子设备,防盗取检测模型包括克隆器及生成器,克隆器用于克隆预先训练的业务模型,生成器用于生成输入所述克隆器的仿真业务数据。先将噪声输入生成器,获得第一仿真业务数据,并通过克隆器获得第一仿真业务数据的第一业务结果。再根据第一业务结果及第一仿真业务数据,以提高克隆器输出结果的错误率为训练目标,对生成器进行训练。接着,将噪声输入训练后的生成器,获得第二仿真业务数据,通过克隆器及业务模型获得第二仿真业务数据的第二业务结果及标签。最后,根据第二业务结果及标签,对克隆器进行训练,利用训练过程中的克隆器的迭代次数,检测业务模型的防盗取能力。
-
公开(公告)号:CN117592056B
公开(公告)日:2025-03-11
申请号:CN202311564982.2
申请日:2023-11-21
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F21/57 , G06N3/0475 , G06N3/0464 , G06N3/09
Abstract: 本说明书公开了一种模型的防盗取检测方法、装置、存储介质和电子设备,防盗取检测模型包括克隆器及生成器,克隆器用于克隆预先训练的业务模型,生成器用于生成输入所述克隆器的仿真业务数据。先将噪声输入生成器,获得第一仿真业务数据,并通过克隆器获得第一仿真业务数据的第一业务结果。再根据第一业务结果及第一仿真业务数据,以提高克隆器输出结果的错误率为训练目标,对生成器进行训练。接着,将噪声输入训练后的生成器,获得第二仿真业务数据,通过克隆器及业务模型获得第二仿真业务数据的第二业务结果及标签。最后,根据第二业务结果及标签,对克隆器进行训练,利用训练过程中的克隆器的迭代次数,检测业务模型的防盗取能力。
-
公开(公告)号:CN117540791A
公开(公告)日:2024-02-09
申请号:CN202410013557.2
申请日:2024-01-03
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06N3/094 , G06N3/0464 , G06N3/045 , G06N3/044 , G06N3/0475 , G06N3/084 , G06F18/23213 , G06Q20/40
Abstract: 本说明书实施例涉及一种对抗训练的方法及装置,方法包括:首先,获取基于训练集训练的第一模型,训练集中各训练样本包含结构化的特征数据及标签。然后,基于第一模型针对各个训练样本的总预测损失对特征数据的梯度值,确定目标权重向量。接下来,将目标权重向量施加于各训练样本的特征数据,得到各第一结果向量,并构建检索集。最后,基于训练集和检索集对第二模型进行多轮训练;任意一轮训练包括:使用训练集中部分训练样本训练第二模型;基于对抗训练算法与第二模型,确定部分训练样本对应的对抗样本特征;利用对抗样本特征在检索集中进行检索,从而确定各个对抗样本特征的标签,并构建对抗训练集;使用对抗训练集训练第二模型。
-
公开(公告)号:CN117540791B
公开(公告)日:2024-04-05
申请号:CN202410013557.2
申请日:2024-01-03
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06N3/094 , G06N3/0464 , G06N3/045 , G06N3/044 , G06N3/0475 , G06N3/084 , G06F18/23213 , G06Q20/40
Abstract: 本说明书实施例涉及一种对抗训练的方法及装置,方法包括:首先,获取基于训练集训练的第一模型,训练集中各训练样本包含结构化的特征数据及标签。然后,基于第一模型针对各个训练样本的总预测损失对特征数据的梯度值,确定目标权重向量。接下来,将目标权重向量施加于各训练样本的特征数据,得到各第一结果向量,并构建检索集。最后,基于训练集和检索集对第二模型进行多轮训练;任意一轮训练包括:使用训练集中部分训练样本训练第二模型;基于对抗训练算法与第二模型,确定部分训练样本对应的对抗样本特征;利用对抗样本特征在检索集中进行检索,从而确定各个对抗样本特征的标签,并构建对抗训练集;使用对抗训练集训练第二模型。
-
公开(公告)号:CN117057597A
公开(公告)日:2023-11-14
申请号:CN202310870163.4
申请日:2023-07-14
Applicant: 清华大学 , 支付宝(杭州)信息技术有限公司
IPC: G06Q10/0635 , G06F18/214
Abstract: 本说明书实施例提供了一种风控模型的训练方法和装置。该方法包括:在至少一轮的模型训练中,当前端节点从本地得到本轮模型训练中使用的本地数据;当前端节点利用该本地数据和在之前轮训练出的本地的风控模型,计算并保存梯度信息;当前端节点向各邻居端节点发送当前保存的梯度信息;当前端节点利用各邻居端节点发来的梯度信息,更新当前端节点保存的梯度信息;当前端节点得到在本轮模型训练中梯度同步结束后最终保存的梯度信息;当前端节点利用该最终保存的梯度信息得到本轮训练出的本地的风控模型,直至该风控模型收敛。本说明书实施例能够减少隐私被泄露的风险,并减少对网络资源的占用。
-
公开(公告)号:CN119046174B
公开(公告)日:2025-05-16
申请号:CN202411535888.9
申请日:2024-10-30
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F11/3604 , G06F18/20 , G06V10/40 , G06F40/126 , G06N3/0455 , G06N3/08
Abstract: 本说明书公开了一种模型训练以及页面检测方法、装置、介质及设备。获取样本页面图像,样本页面图像对应的导航文本以及标签文本。将样本页面图像与导航文本输入到预设的大语言模型,以使大语言模型根据导航文本,确定输出文本,输出文本中包含有目标控件在页面中所在位置的预测坐标表征。将预测坐标表征输入到待训练的坐标解码器,得到目标控件在页面中所在位置的预测坐标。根据预测坐标与实际页面坐标之间的差异,确定综合损失值,以根据综合损失值,对坐标解码器进行训练。使得训练完成的坐标解码器能够对大语言模型输出的预测坐标表征进行纠正,提高页面检测准确性。
-
公开(公告)号:CN117932615A
公开(公告)日:2024-04-26
申请号:CN202410077208.7
申请日:2024-01-18
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书公开了一种风险检测方法、装置、存储介质以及电子设备,通过对获取到的明文数据进行脱敏处理,确定出对应的脱敏后数据。然后将脱敏后数据输入到预先经过训练的数据重构模型中,以使得数据重构模型能够根据脱敏后数据,生成出针对明文数据的重构数据。进而根据明文数据和脱敏后数据,以及明文数据对应的重构数据,确定通过脱敏后数据得到明文数据的最小错误率。最后根据最小错误率,对明文数据的脱敏后数据进行风险检测。通过本说明书中的方法能够精准的识别出对原明文数据所对应的脱敏数据是否具有泄露明文数据的风险,有效提高了原明文数据在使用和传输时的安全性,极大程度上维护了原明文数据所属用户或团体的信息安全和数据隐私。
-
-
-
-
-
-
-