一种模型的训练方法、装置及设备

    公开(公告)号:CN114241268B

    公开(公告)日:2024-09-03

    申请号:CN202111574537.5

    申请日:2021-12-21

    Abstract: 本说明书实施例公开了一种模型的训练方法、装置及设备,该方法包括:获取第一数量的第一训练样本,然后,从所述第一数量的第一训练样本中选取第二数量的第一训练样本,并分别向第二数量的第一训练样本中加入相应的噪声数据,得到所述第二数量的第二训练样本,最终,可以基于剩余的第一训练样本和所述第二数量的第二训练样本,通过预设的基于梯度的对抗攻击算法对目标模型进行训练,得到训练后的目标模型。

    一种模型溯源方法、装置、设备及可读存储介质

    公开(公告)号:CN117932572A

    公开(公告)日:2024-04-26

    申请号:CN202410109966.2

    申请日:2024-01-25

    Abstract: 本说明书公开了一种模型溯源方法、装置、设备及可读存储介质,获取待检测数据,并对待检测数据进行水印检测,得到待检测数据的水印检测结果,从水印检测结果中提取生成待检测数据所采用的待检测模型对应的目标信息,根据目标信息和数据库中包含的各参考模型的参考信息,确定待检测数据对应的模型溯源结果。可见,通过对待检测数据进行水印检测,并从水印检测结果中提取目标信息的方式,能够有效地验证生成待检测数据所采用的机器学习模型的信息,进而确定待检测数据是否是在机器学习模型被授权使用的前提下生成的,以便即使检测出窃取机器学习模型的功能的攻击者的攻击行为,减少机器学习模型的提供方所收到的侵害以及提高隐私数据的安全性。

    一种语言模型的训练方法、装置、设备及存储介质

    公开(公告)号:CN117313739A

    公开(公告)日:2023-12-29

    申请号:CN202311149563.2

    申请日:2023-09-06

    Abstract: 本申请公开了一种语言模型的训练方法、装置、设备及存储介质,通过确定预训练后的语言模型对应的待定模板,再对第一原始文本进行数据增强,得到增强文本,并将增强文本和待定模板进行组合后得到的第一组合结果输入语言模型中,得到增强文本的输出结果,最后再根据增强文本的输出结果和第一原始文本的标注之间的差距,来调整该语言模型对应的待定模板,以将调整完成的待定模板作为该语言模型匹配的目标模板。本申请通过对第一原始文本进行数据增强来确定增强文本,并通过增强文本对该语言模型对应的待定模板进行调整,使得该语言模型可通过调整完成的待定模板基于原始文本和增强文本都可准确执行自然语言处理任务,保证了语言模型的鲁棒性。

    一种数据处理方法、装置及设备
    25.
    发明公开

    公开(公告)号:CN116702131A

    公开(公告)日:2023-09-05

    申请号:CN202310648022.8

    申请日:2023-06-02

    Abstract: 本说明书实施例公开了一种数据处理方法、装置及设备,该方法包括:获取能够实现对目标模型进行迁移攻击的代理模型,以及所述代理模型的原始样本;对所述代理模型进行结构重参数化处理,得到重参数化代理模型和所述重参数化代理模型的第一模型权重;基于预设的优化搜索规则、所述重参数化代理模型和所述重参数化代理模型的第一模型权重,确定所述重参数化代理模型对应的对抗迁移性评估结果优于预设评估基准的第二模型权重,基于所述第二模型权重更新所述重参数化代理模型,得到更新后的代理模型;基于所述原始样本,通过所述更新后的代理模型,生成用于攻击所述目标模型的对抗样本。

    基于自合成的图像生成方法和系统

    公开(公告)号:CN116612057A

    公开(公告)日:2023-08-18

    申请号:CN202310608634.4

    申请日:2023-05-26

    Abstract: 本公开涉及基于自合成的图像生成方法和系统。该方法包括:对原始图像进行目标检测以确定感兴趣目标的边界框;确定所述边界框内的OCR内容;计算出能够包含所述OCR内容的最小边界框;选择掩模区域,所述掩模区域在所述感兴趣目标的边界框之内并且包含所述最小边界框;对所述掩模区域进行图像增强;以及将经图像增强的所述掩模区域混合到所述原始图像中,以得到自合成的图像。本公开还涉及一种用于交互式限流的系统和装置以及一种非瞬态处理器可读存储介质。

    自然语言处理模型的训练方法、自然语言处理方法和装置

    公开(公告)号:CN116579415A

    公开(公告)日:2023-08-11

    申请号:CN202310258491.9

    申请日:2023-03-10

    Abstract: 本说明书实施例提供了自然语言处理模型的训练方法和装置、自然语言的处理方法和装置。该训练方法包括:利用该自然语言的原始数据集生成原始样本集;利用自然语言的原始数据集生成锚点数据集;利用自然语言的原始样本集生成对抗样本集;将所述锚点数据集及所述对抗样本集分别输入预训练模型中,计算预训练模型的损失,并调整所述预训练模型的参数,直至所述预训练模型收敛,将收敛后的模型作为所述自然语言处理模型。本说明书实施例能够保证自然语言处理模型的识别效果。

    一种数据处理方法、装置及设备
    28.
    发明公开

    公开(公告)号:CN116029441A

    公开(公告)日:2023-04-28

    申请号:CN202310090590.0

    申请日:2023-01-17

    Abstract: 本说明书实施例公开了一种数据处理方法、装置及设备,该方法包括:获取目标业务的业务数据,将该业务数据输入到预先训练的目标模型中,通过目标模型中应用于目标业务的第一子模型和前置稳定器对该业务数据进行预测,得到针对该业务数据的预测结果,目标模型中包括第一子模型和前置稳定器,第一子模型包括多个不同的网络层,前置稳定器包括一个或多个子稳定器,子稳定器设置于第一子模型的一个网络层中,且第一子模型进行模型训练后,保持第一子模型中的模型参数不变,通过对抗样本训练前置稳定器中的参数,得到训练后的目标模型,基于该业务数据的预测结果对目标业务进行业务处理。

    一种模型的训练方法、装置及设备

    公开(公告)号:CN114241268A

    公开(公告)日:2022-03-25

    申请号:CN202111574537.5

    申请日:2021-12-21

    Abstract: 本说明书实施例公开了一种模型的训练方法、装置及设备,该方法包括:获取第一数量的第一训练样本,然后,从所述第一数量的第一训练样本中选取第二数量的第一训练样本,并分别向第二数量的第一训练样本中加入相应的噪声数据,得到所述第二数量的第二训练样本,最终,可以基于剩余的第一训练样本和所述第二数量的第二训练样本,通过预设的基于梯度的对抗攻击算法对目标模型进行训练,得到训练后的目标模型。

    一种风险识别模型的确定方法及装置

    公开(公告)号:CN113313575A

    公开(公告)日:2021-08-27

    申请号:CN202110640452.6

    申请日:2021-06-08

    Abstract: 本说明书一个或多个实施例提供了一种风险识别模型的确定方法及装置,其中,该方法包括:获取目标业务对应的模型训练样本数据和针对目标业务所配置的风控策略信息;基于该模型训练样本数据和用于风险识别的分类模型,对各风控策略信息对应的策略权重进行更新,得到更新后的策略权重;基于该模型训练样本数据和更新后的策略权重,对该分类模型的模型参数进行更新,得到更新后的分类模型;若更新后的分类模型满足预设模型优化终止条件,则将该更新后的分类模型确定为训练后的风险识别模型;若更新后的分类模型不满足预设模型优化终止条件,则将该分类模型作为下一轮策略权重更新所用的用于风险识别的分类模型。

Patent Agency Ranking