-
公开(公告)号:CN119046174B
公开(公告)日:2025-05-16
申请号:CN202411535888.9
申请日:2024-10-30
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F11/3604 , G06F18/20 , G06V10/40 , G06F40/126 , G06N3/0455 , G06N3/08
Abstract: 本说明书公开了一种模型训练以及页面检测方法、装置、介质及设备。获取样本页面图像,样本页面图像对应的导航文本以及标签文本。将样本页面图像与导航文本输入到预设的大语言模型,以使大语言模型根据导航文本,确定输出文本,输出文本中包含有目标控件在页面中所在位置的预测坐标表征。将预测坐标表征输入到待训练的坐标解码器,得到目标控件在页面中所在位置的预测坐标。根据预测坐标与实际页面坐标之间的差异,确定综合损失值,以根据综合损失值,对坐标解码器进行训练。使得训练完成的坐标解码器能够对大语言模型输出的预测坐标表征进行纠正,提高页面检测准确性。
-
公开(公告)号:CN119025879B
公开(公告)日:2025-02-28
申请号:CN202411515145.5
申请日:2024-10-28
Applicant: 支付宝(杭州)信息技术有限公司 , 清华大学
IPC: G06F18/21 , G06F18/214 , G06N5/04
Abstract: 本说明书实施例公开了一种大模型的安全性测评方法、装置及设备,该方法包括:获取用于对目标大模型进行安全性测评所需使用的测试集,测试集中包括测试样本数据和对应的标签信息;确定测试样本数据中后门触发器的停用词权重比例阈值,基于停用词权重比例阈值对预设的多个初始停用词组中的基准停用词当前所在的初始停用词组进行调整,得到多个目标停用词组;将测试样本数据中包含的当前处于第一目标停用词组的停用词,使用多个目标停用词组中的其它目标停用词组中与停用词相匹配的基准停用词替换,直到停用词权重比例满足预设条件,得到替换后的测试集;基于替换后的测试集对目标大模型进行安全性测评,以判断目标大模型是否存在越狱攻击风险。
-
公开(公告)号:CN114638998B
公开(公告)日:2025-02-21
申请号:CN202210222892.4
申请日:2022-03-07
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06V10/774 , G06V10/84 , G06V10/776 , G06V10/764 , G06V10/82 , G06F21/60 , G06F21/64 , G06N3/042
Abstract: 本说明书实施例提供了一种模型更新方法、装置、系统及设备,其中,该方法包括:接收针对第一特征提取模型的更新请求,并基于待训练的第一特征提取模型和第一图结构数据,确定与所述第一图结构数据对应的第一特征向量,所述第一图结构数据由目标用户的第一特征信息确定;将所述第一特征向量发送给服务端,并接收所述服务端发送的模型参数,所述模型参数由所述服务端基于所述第一特征向量、第二特征向量,对待训练的第一分类模型进行训练,得到的训练后的第一分类模型的参数;基于所述模型参数,对所述第一特征提取模型进行更新处理,并基于更新处理后的第一特征提取模型对本地用户数据进行分类处理。
-
公开(公告)号:CN114091670B
公开(公告)日:2025-01-03
申请号:CN202111397100.9
申请日:2021-11-23
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06N5/01 , G06N20/20 , G06F18/243 , G06F18/40
Abstract: 本说明书公开了一种模型线上更新方法及装置。所述方法包括:获取预设树模型的副本和新训练样本集合;所述预设树模型为:当前线上运行的提升树模型或当前线上运行的梯度提升决策树模型;将所述副本当前的叶子节点输出值确定为旧叶子节点输出值;在保持所述副本结构不变的情况下,根据所述新训练样本集合更新所述副本的叶子节点输出值,将更新后的叶子节点输出值确定为新叶子节点输出值;针对所述副本的每个叶子节点,计算对应的新叶子节点输出值和对应的旧叶子节点输出值的加权和,并将该叶子节点的输出值更新为所述加权和,得到新的副本树模型;将所述新的副本树模型部署到线上,所述新的副本树模型用于在预设情况下替换所述预设树模型。
-
公开(公告)号:CN119025879A
公开(公告)日:2024-11-26
申请号:CN202411515145.5
申请日:2024-10-28
Applicant: 支付宝(杭州)信息技术有限公司 , 清华大学
IPC: G06F18/21 , G06F18/214 , G06N5/04
Abstract: 本说明书实施例公开了一种大模型的安全性测评方法、装置及设备,该方法包括:获取用于对目标大模型进行安全性测评所需使用的测试集,测试集中包括测试样本数据和对应的标签信息;确定测试样本数据中后门触发器的停用词权重比例阈值,基于停用词权重比例阈值对预设的多个初始停用词组中的基准停用词当前所在的初始停用词组进行调整,得到多个目标停用词组;将测试样本数据中包含的当前处于第一目标停用词组的停用词,使用多个目标停用词组中的其它目标停用词组中与停用词相匹配的基准停用词替换,直到停用词权重比例满足预设条件,得到替换后的测试集;基于替换后的测试集对目标大模型进行安全性测评,以判断目标大模型是否存在越狱攻击风险。
-
公开(公告)号:CN115081334B
公开(公告)日:2024-11-26
申请号:CN202210768050.9
申请日:2022-06-30
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F30/27 , G06F119/02
Abstract: 公开了一种用于预测用户的年龄段或性别的方法,包括:接收用户在触摸面板上的手势输入;基于手势输入生成手势信息;以及利用机器学习模型,基于手势信息来预测用户的年龄段和性别中的至少一者。还公开了用于预测用户的年龄段或性别的系统、装置和介质。
-
公开(公告)号:CN118839789A
公开(公告)日:2024-10-25
申请号:CN202410978378.2
申请日:2024-07-19
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书公开了一种模型训练方法、图像生成方法、装置及电子设备。在此方法中,首先获取基础图像以及第一描述文本,将基础图像以及第一描述文本输入到待训练的图像生成模型中,以使图像生成模型确定基础图像对应的图像特征以及第一描述文本对应的文本特征,并基于基础图像对应的图像特征以及第一描述文本对应的文本特征,生成目标对象以参考对象的体貌特征在指定环境中的图像,作为输出图像,根据输出图像对应的图像特征与基础图像对应的图像特征之间的特征偏差,以及输出图像所表达的图像内容的特征与第一描述文本对应的文本特征之间的相似度,确定综合损失函数值,并根据综合损失函数值,对图像生成模型进行训练。
-
公开(公告)号:CN118674041A
公开(公告)日:2024-09-20
申请号:CN202410702468.9
申请日:2024-05-31
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例公开了一种基于大语言模型执行业务的方法和装置,确定待执行问答业务对应的用户问题,将所述用户问题输入到智能体模型中,以使所述智能体模型根据所述用户问题检索所述智能体模型中预先存储的知识图谱,确定出用于回复所述用户问题的图谱子结构,并生成所述图谱子结构对应的推理提示。将所述推理提示输入到大语言模型中,以使所述大语言模型根据所述推理提示,生成所述图谱子结构对应的回复,作为所述用户问题的回复。
-
公开(公告)号:CN118672902A
公开(公告)日:2024-09-20
申请号:CN202410697648.2
申请日:2024-05-31
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例公开了一种测试用例的生成方法、装置、存储介质及电子设备,首先获取评测种子数据,然后结合训练好的生成大模型,设计并选取至少一种诱导攻击手法,通过对评测种子数据进行变形处理生成多样化的测试用例集,同时自动生成测试用例集中各个测试用例的用例标注。
-
公开(公告)号:CN118656491A
公开(公告)日:2024-09-17
申请号:CN202410705697.6
申请日:2024-05-31
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/35 , G06F40/289 , G06N3/0464 , G06N3/08
Abstract: 本说明书实施例提供一种判别模型的训练方法及装置,该判别模型用于判断输入文本是否为大模型的训练集中的成员文本,以对大模型进行隐私安全验证。该训练方法包括:构造目标样本,其中包括,获取N个文本打分对,其中任一文本打分对中的打分利用大模型预测得到。基于查询文本和N个文本打分对构建提示文本,该提示文本指示将N个文本打分对作为上下文,并基于该上下文对查询文本进行打分。将该提示文本输入大模型,得到查询文本对应的目标打分,该目标打分指示该查询文本与上下文的相关性。基于查询文本和目标打分,形成目标样本。基于目标样本,训练判别模型。
-
-
-
-
-
-
-
-
-