文本数据的保密处理方法和装置

    公开(公告)号:CN113987592A

    公开(公告)日:2022-01-28

    申请号:CN202111617403.7

    申请日:2021-12-28

    Abstract: 本说明书实施例提供了一种文本数据的保密处理方法和装置。该方法包括:得到原始文本数据;将所述原始文本数据输入预先训练的文本生成模型,得到该文本生成模型输出的相似文本数据;该相似文本数据与原始文本数据的文本内容不同,但,该相似文本数据与原始文本数据的语义相似度大于预定值;提供所述相似文本数据。本说明书实施例能够更为有效地阻止文本数据内容的泄露。

    信息处理方法、装置、电子设备及存储介质

    公开(公告)号:CN111539742A

    公开(公告)日:2020-08-14

    申请号:CN202010468961.0

    申请日:2020-05-28

    Abstract: 本说明书提供了一种信息处理方法,包括:接收来自第一用户的资源转移请求;确定所述资源转移请求对应的目标第二用户;其中,所述目标第二用户为所述第一用户意图进行资源转移的资源接收方;建立所述第一用户与所述目标第二用户的通信连接;接收所述第一用户针对所述资源转移请求的处理指令;以及根据所述处理指令对所述资源转移请求进行处理。本说明书还提供了实现上述方法的信息处理装置、电子设备及存储介质。

    内容生成模型的测试方法、装置、介质及设备

    公开(公告)号:CN119201684A

    公开(公告)日:2024-12-27

    申请号:CN202411167358.3

    申请日:2024-08-23

    Abstract: 本说明书实施例公开了一种内容生成模型的测试方法、装置、介质及设备。本方案可以在可信执行环境中实现,以保护数据隐私。在内容生成模型的测试过程中,并不会采用预先固定好的提示内容作为测试题目,来诱导内容生成模型输出不符合设定要求的生成内容。而是采用“主题与算法组合”的方式,在测试过程中即时创建测试用例,通过执行测试用例,可以以诱导内容生成模型输出不符合设定要求的生成内容为目的,向所述内容生成模型输入关联所述主题信息的提示内容,完成测试。

    一种模型真实性评测方法、装置及设备

    公开(公告)号:CN118674054A

    公开(公告)日:2024-09-20

    申请号:CN202410714466.1

    申请日:2024-06-03

    Abstract: 本说明书实施例公开了一种模型真实性评测方法、装置及设备,该方法包括:获取用于对目标模型进行真实性评测的第一问题数据,将第一问题数据输入到目标模型中,得到第一问题数据对应的第一响应结果;提取第一问题数据中包含的命名实体,基于命名实体和第一问题数据,构建第二问题数据,第二问题数据用于触发目标模型输出针对第一问题数据的分析依据和结果;将第二问题数据输入到目标模型中,得到第二问题数据对应的模型预测结果,模型预测结果包括对第一问题数据进行分析得到的分析依据信息和第一问题数据对应的第二响应结果;基于第一响应结果和模型预测结果,确定目标模型的真实性评测结果。

    一种测试用例的生成方法及装置
    15.
    发明公开

    公开(公告)号:CN116974916A

    公开(公告)日:2023-10-31

    申请号:CN202310835466.2

    申请日:2023-07-07

    Abstract: 本说明书一个或多个实施例公开了一种测试用例的生成方法,首先获取生成控制条件,该生成控制条件用于生成对待测大模型进行风险评测的测试用例的控制条件,且该生成控制条件中至少包括引导并生成能够评测出待测大模型存在风险的测试用例的引导信息;然后将生成控制条件输入到预先训练的对抗大模型中,得到与生成控制条件相匹配的测试用例,其中,对抗大模型是基于预设的预训练大模型、样例控制条件和样例控制条件对应的目标测试样例,通过预设的损失函数进行模型训练得到的模型,预设的损失函数至少包括基于生成的测试用例之间具有的对抗性而构建的第一子损失函数。

    一种网络模型的防攻击能力测试方法及装置

    公开(公告)号:CN115643056A

    公开(公告)日:2023-01-24

    申请号:CN202211213698.6

    申请日:2022-09-30

    Abstract: 本说明书实施例提供了一种网络模型的防攻击能力测试方法及装置。在该方法中,服务平台执行可以提供自定义待测试的网络模型,自定义针对网络模型的自然测试集,自定义针对网络模型的攻击方式,以及自定义用于评估网络模型的防攻击效果的评估指标的功能。当确定待检测的网络模型以及自然测试集、攻击方式和评估指标之后,可以利用自然测试集,在攻击方式下确定网络模型输出的预测结果,并基于评估指标和预测结果,对网络模型的防攻击能力进行评估,得到评估结果。

    生成对抗样本的方法及装置

    公开(公告)号:CN113313404B

    公开(公告)日:2022-12-06

    申请号:CN202110662087.9

    申请日:2021-06-15

    Abstract: 本说明书实施例提供一种生成对抗样本的方法和装置,其中方法包括,首先获取目标风险样本的原始样本特征以及风险检测模型。针对该目标风险样本,在预定特征空间中,确定预定数目T个基准方向;依次按照T个基准方向中的不同基准方向,以预设的第一步长,执行若干轮特征变换,直到得到第一变换特征,其中风险检测模型针对该第一变换特征的预测值落入非风险样本对应的预定区间。然后,针对该第一变换特征,沿最后一次特征变换方向的逆向,以依次增大的回退幅度执行若干次回退操作,直到得到第二变换特征,该风险检测模型针对第二变换特征的预测值达到前述预定区间的边界。于是,可以根据该第二变换特征,形成目标风险样本对应的对抗样本。

    业务预测方法和装置
    18.
    发明公开

    公开(公告)号:CN115169666A

    公开(公告)日:2022-10-11

    申请号:CN202210740054.6

    申请日:2022-06-28

    Inventor: 崔世文

    Abstract: 本说明书实施例提供了业务预测方法和装置。根据实施例的方法,首先从业务事件中获取业务数据。然后基于包含攻击样本数据的第一样本数据和业务数据预测得到第一业务预测结果,并基于不包含攻击样本数据的第二样本数据和业务数据预测得到第二业务预测结果。进一步,通过将第一业务预测结果和第二业务预测结果进行融合,即可得到业务的最终业务预测结果。由于第一样本数据中包含攻击样本数据,而第二样本数据中不包含攻击样本数据,这使得第一业务预测结果为具有攻击对抗性的预测结果,而第二业务预测结果为非攻击对抗性的预测结果。通过将两种预测结果进行融合,能够充分考虑两者的优势,从而提高业务预测的准确性。

    一种自动化对抗训练方法和装置
    19.
    发明公开

    公开(公告)号:CN114491448A

    公开(公告)日:2022-05-13

    申请号:CN202210078449.4

    申请日:2022-01-24

    Abstract: 本公开的一方面涉及一种自动化对抗训练方法,包括获取原始训练数据集和经使用所述原始训练数据集训练的模型,所述原始训练数据集包括输入数据及其标签;对所述输入数据自动进行预定步数的扰动,包括对于所述预定步数中的每一步:在预定义的攻击超参数搜索空间中自动搜索对这一步的扰动最优的超参数值;基于所述最优的超参数值自动确定所述这一步的扰动;以及通过纳入所述这一步的扰动来更新所述输入数据;以及使用包括经所述预定步数的扰动之后的经更新输入数据及其标签的对抗训练数据集来进一步优化所述模型以对抗所述扰动。本公开还涉及其他相关方面。

    一种大模型的风险测评方法、装置及设备

    公开(公告)号:CN118964167A

    公开(公告)日:2024-11-15

    申请号:CN202410833629.8

    申请日:2024-06-25

    Abstract: 本说明书实施例公开了一种大模型的风险测评方法、装置及设备,该方法包括:获取用于对目标大模型进行风险测评的测试集,测试集中包括测试数据、测试数据对应的辅助测试结果和辅助测试结果对应的标签信息,测试数据包括一种或多种不同模态的数据,辅助测试结果是将测试数据分别输入到一个或多个不同的辅助测评模型中后得到的每个辅助测评模型输出的测试数据对应的辅助测试结果;将测试数据输入到目标大模型中,得到测试数据对应的测试结果;从获取的辅助测试结果中查找与测试结果相匹配的目标辅助测试结果,并基于目标辅助测试结果对应的标签信息,确定测试结果对应的标签信息,基于测试结果对应的标签信息,确定目标大模型的风险测评结果。

Patent Agency Ranking