一种大模型的安全性测评方法、装置及设备

    公开(公告)号:CN119025879B

    公开(公告)日:2025-02-28

    申请号:CN202411515145.5

    申请日:2024-10-28

    Abstract: 本说明书实施例公开了一种大模型的安全性测评方法、装置及设备,该方法包括:获取用于对目标大模型进行安全性测评所需使用的测试集,测试集中包括测试样本数据和对应的标签信息;确定测试样本数据中后门触发器的停用词权重比例阈值,基于停用词权重比例阈值对预设的多个初始停用词组中的基准停用词当前所在的初始停用词组进行调整,得到多个目标停用词组;将测试样本数据中包含的当前处于第一目标停用词组的停用词,使用多个目标停用词组中的其它目标停用词组中与停用词相匹配的基准停用词替换,直到停用词权重比例满足预设条件,得到替换后的测试集;基于替换后的测试集对目标大模型进行安全性测评,以判断目标大模型是否存在越狱攻击风险。

    一种大模型的安全性测评方法、装置及设备

    公开(公告)号:CN119025879A

    公开(公告)日:2024-11-26

    申请号:CN202411515145.5

    申请日:2024-10-28

    Abstract: 本说明书实施例公开了一种大模型的安全性测评方法、装置及设备,该方法包括:获取用于对目标大模型进行安全性测评所需使用的测试集,测试集中包括测试样本数据和对应的标签信息;确定测试样本数据中后门触发器的停用词权重比例阈值,基于停用词权重比例阈值对预设的多个初始停用词组中的基准停用词当前所在的初始停用词组进行调整,得到多个目标停用词组;将测试样本数据中包含的当前处于第一目标停用词组的停用词,使用多个目标停用词组中的其它目标停用词组中与停用词相匹配的基准停用词替换,直到停用词权重比例满足预设条件,得到替换后的测试集;基于替换后的测试集对目标大模型进行安全性测评,以判断目标大模型是否存在越狱攻击风险。

    一种数据处理方法、装置及设备

    公开(公告)号:CN119026636B

    公开(公告)日:2025-02-28

    申请号:CN202411514637.2

    申请日:2024-10-28

    Abstract: 本说明书实施例公开了一种数据处理方法、装置及设备,该方法包括:获取用于对图神经网络模型进行模型训练的图结构数据,所述图结构数据中包括节点、边和节点特征;根据预先设定的隐私数据遗忘要求,对所述图结构数据中包含的隐私数据进行定位,并根据定位结果确定所述图结构数据中位于所述隐私数据对应的遗忘范围内的目标子图数据;通过与所述隐私数据遗忘要求对应的类型相匹配的对冲规则,调整所述目标子图数据中的数据生成所述目标子图数据对应的对冲子图数据;基于所述目标子图数据和所述对冲子图数据,通过对比学习的方式对所述图神经网络模型进行模型训练,得到训练后的图神经网络模型。

    一种数据处理方法、装置及设备

    公开(公告)号:CN119026636A

    公开(公告)日:2024-11-26

    申请号:CN202411514637.2

    申请日:2024-10-28

    Abstract: 本说明书实施例公开了一种数据处理方法、装置及设备,该方法包括:获取用于对图神经网络模型进行模型训练的图结构数据,所述图结构数据中包括节点、边和节点特征;根据预先设定的隐私数据遗忘要求,对所述图结构数据中包含的隐私数据进行定位,并根据定位结果确定所述图结构数据中位于所述隐私数据对应的遗忘范围内的目标子图数据;通过与所述隐私数据遗忘要求对应的类型相匹配的对冲规则,调整所述目标子图数据中的数据生成所述目标子图数据对应的对冲子图数据;基于所述目标子图数据和所述对冲子图数据,通过对比学习的方式对所述图神经网络模型进行模型训练,得到训练后的图神经网络模型。

    一种训练风险识别模型的方法及装置

    公开(公告)号:CN117743856A

    公开(公告)日:2024-03-22

    申请号:CN202311845208.9

    申请日:2023-12-28

    Abstract: 本说明书实施例涉及一种训练风险识别模型的方法及装置,方法包括:首先,获取有硬标签的第一样本集,以及无标签的第二样本集,任一样本集包括交易样本,硬标签指示交易是否为风险交易。然后,基于插值法对第一样本集进行样本增强,并使用增强后的第一样本集训练得到第一模型。接下来,将第一样本集和第二样本集构成的样本总集中的各个交易样本输入到第一模型中,得到关于风险预测的软标签。最后,将第一样本集中的交易样本输入到第二模型中,基于硬标签确定第一损失;将样本总集中的交易样本输入到第二模型中,基于软标签确定第二损失;基于第一损失和第二损失所确定的总预测损失,对第二模型进行训练,第二模型用于预测交易是否为风险交易。

    风控模型的训练方法和装置
    6.
    发明公开

    公开(公告)号:CN117057597A

    公开(公告)日:2023-11-14

    申请号:CN202310870163.4

    申请日:2023-07-14

    Abstract: 本说明书实施例提供了一种风控模型的训练方法和装置。该方法包括:在至少一轮的模型训练中,当前端节点从本地得到本轮模型训练中使用的本地数据;当前端节点利用该本地数据和在之前轮训练出的本地的风控模型,计算并保存梯度信息;当前端节点向各邻居端节点发送当前保存的梯度信息;当前端节点利用各邻居端节点发来的梯度信息,更新当前端节点保存的梯度信息;当前端节点得到在本轮模型训练中梯度同步结束后最终保存的梯度信息;当前端节点利用该最终保存的梯度信息得到本轮训练出的本地的风控模型,直至该风控模型收敛。本说明书实施例能够减少隐私被泄露的风险,并减少对网络资源的占用。

    一种模型的处理方法、装置及设备

    公开(公告)号:CN115345233A

    公开(公告)日:2022-11-15

    申请号:CN202210974842.1

    申请日:2022-08-15

    Abstract: 本说明书实施例公开了一种模型的处理方法、装置及设备,该方法应用于终端设备,包括:接收服务器发送的第一模型,获取第一训练样本数据,以对第一模型进行训练,并对第一模型的模型结构进行调整,得到目标模型,将目标模型对应的模型更新数据发送给服务器,以使服务器确定得到目标模型所使用的时长,并基于不同终端设备提供的模型更新数据对当前的模型进行更新,得到第二模型,并在确定第二模型需要裁剪时,确定对第二模型的裁剪程度和对第二模型进行训练所使用的时长,获取第二训练样本数据,并结合对第二模型进行训练所使用的时长对第二模型进行训练,并通过该裁剪程度对第二模型进行调整,得到第三模型,将第三模型发送给服务器。

    模型更新方法、装置、系统及设备

    公开(公告)号:CN114638998B

    公开(公告)日:2025-02-21

    申请号:CN202210222892.4

    申请日:2022-03-07

    Abstract: 本说明书实施例提供了一种模型更新方法、装置、系统及设备,其中,该方法包括:接收针对第一特征提取模型的更新请求,并基于待训练的第一特征提取模型和第一图结构数据,确定与所述第一图结构数据对应的第一特征向量,所述第一图结构数据由目标用户的第一特征信息确定;将所述第一特征向量发送给服务端,并接收所述服务端发送的模型参数,所述模型参数由所述服务端基于所述第一特征向量、第二特征向量,对待训练的第一分类模型进行训练,得到的训练后的第一分类模型的参数;基于所述模型参数,对所述第一特征提取模型进行更新处理,并基于更新处理后的第一特征提取模型对本地用户数据进行分类处理。

    一种模型线上更新方法及装置

    公开(公告)号:CN114091670B

    公开(公告)日:2025-01-03

    申请号:CN202111397100.9

    申请日:2021-11-23

    Abstract: 本说明书公开了一种模型线上更新方法及装置。所述方法包括:获取预设树模型的副本和新训练样本集合;所述预设树模型为:当前线上运行的提升树模型或当前线上运行的梯度提升决策树模型;将所述副本当前的叶子节点输出值确定为旧叶子节点输出值;在保持所述副本结构不变的情况下,根据所述新训练样本集合更新所述副本的叶子节点输出值,将更新后的叶子节点输出值确定为新叶子节点输出值;针对所述副本的每个叶子节点,计算对应的新叶子节点输出值和对应的旧叶子节点输出值的加权和,并将该叶子节点的输出值更新为所述加权和,得到新的副本树模型;将所述新的副本树模型部署到线上,所述新的副本树模型用于在预设情况下替换所述预设树模型。

Patent Agency Ranking