一种模型训练的方法、装置、存储介质及电子设备

    公开(公告)号:CN115618237A

    公开(公告)日:2023-01-17

    申请号:CN202211590716.2

    申请日:2022-12-12

    Abstract: 本说明书提供了一种模型训练的方法、装置、存储介质及电子设备。在本说明书提供的模型训练方法中,获取训练样本、样本标签以及打标环境信息;将所述训练样本输入待训练的目标模型中,确定所述目标模型的输出结果;将所述打标环境信息输入置信度网络中,通过所述置信度网络输出所述样本标签的置信度;根据所述样本标签的置信度,调整所述目标模型的输出结果,得到修正结果;以所述修正结果与所述样本标签之间的差异最小为优化目标,对所述目标模型与所述置信度网络进行训练。采用本说明书提供的模型训练方法对模型进行有监督训练时,能够根据样本标签的可信程度对模型的输出结果进行修正,保证模型的训练效果,同时使标签的利用率最大化。

    一种事件的处理方法、装置及设备

    公开(公告)号:CN113992429A

    公开(公告)日:2022-01-28

    申请号:CN202111580928.8

    申请日:2021-12-22

    Abstract: 本说明书实施例公开了一种事件的处理方法、装置及设备,该方法包括:获取目标事件的事件处理请求,其中,该事件处理请求中包括目标事件的事件信息,如果该事件信息满足预设的第一条件,则从预设的知识库中获取目标事件对应的风险防控规则,并将该事件信息分别与获取的目标事件对应的风险防控规则进行匹配,得到与该事件信息相匹配的第一规则,然后,可以基于与该事件信息相匹配的第一规则,确定该事件信息对应的预测风险信息,将该事件信息对应的预测风险信息和该事件信息输入到目标事件对应的风险防控模型中,得到该事件信息对应的风险信息,最终,可以基于该事件信息对应的风险信息对目标事件进行处理。

    生成对抗样本的方法及装置

    公开(公告)号:CN113313404A

    公开(公告)日:2021-08-27

    申请号:CN202110662087.9

    申请日:2021-06-15

    Abstract: 本说明书实施例提供一种生成对抗样本的方法和装置,其中方法包括,首先获取目标风险样本的原始样本特征以及风险检测模型。针对该目标风险样本,在预定特征空间中,确定预定数目T个基准方向;依次按照T个基准方向中的不同基准方向,以预设的第一步长,执行若干轮特征变换,直到得到第一变换特征,其中风险检测模型针对该第一变换特征的预测值落入非风险样本对应的预定区间。然后,针对该第一变换特征,沿最后一次特征变换方向的逆向,以依次增大的回退幅度执行若干次回退操作,直到得到第二变换特征,该风险检测模型针对第二变换特征的预测值达到前述预定区间的边界。于是,可以根据该第二变换特征,形成目标风险样本对应的对抗样本。

    多任务预测模型的训练、事件类型的预测方法及装置

    公开(公告)号:CN111738534B

    公开(公告)日:2020-12-04

    申请号:CN202010851731.2

    申请日:2020-08-21

    Abstract: 本说明书实施例提供一种多任务预测模型的训练、事件类型的预测方法及装置,在训练方法中,获取初始样本集。对于任意的第一样本,在前i‑1棵决策树中,获取包括第一样本的各叶子节点各自的N个分数。基于各叶子节点各自的N个分数以及第一样本的N个标签值,确定若干梯度,并执行第一融合,得到第一样本的融合梯度。对于第i棵决策树的当前节点,获取分割到当前节点的样本集中各样本的融合梯度。基于当前样本集中各样本的融合梯度,从各样本特征以及当前样本集中各样本对应于各样本特征的特征值中,分别确定出当前节点的分裂特征和特征阈值。基于当前节点的分裂特征和特征阈值,对当前样本集进行分割,生成当前节点对应的子节点,直至到达叶子节点。

    多任务预测模型的训练、事件类型的预测方法及装置

    公开(公告)号:CN111738534A

    公开(公告)日:2020-10-02

    申请号:CN202010851731.2

    申请日:2020-08-21

    Abstract: 本说明书实施例提供一种多任务预测模型的训练、事件类型的预测方法及装置,在训练方法中,获取初始样本集。对于任意的第一样本,在前i-1棵决策树中,获取包括第一样本的各叶子节点各自的N个分数。基于各叶子节点各自的N个分数以及第一样本的N个标签值,确定若干梯度,并执行第一融合,得到第一样本的融合梯度。对于第i棵决策树的当前节点,获取分割到当前节点的样本集中各样本的融合梯度。基于当前样本集中各样本的融合梯度,从各样本特征以及当前样本集中各样本对应于各样本特征的特征值中,分别确定出当前节点的分裂特征和特征阈值。基于当前节点的分裂特征和特征阈值,对当前样本集进行分割,生成当前节点对应的子节点,直至到达叶子节点。

    一种模型线上更新方法及装置

    公开(公告)号:CN114091670B

    公开(公告)日:2025-01-03

    申请号:CN202111397100.9

    申请日:2021-11-23

    Abstract: 本说明书公开了一种模型线上更新方法及装置。所述方法包括:获取预设树模型的副本和新训练样本集合;所述预设树模型为:当前线上运行的提升树模型或当前线上运行的梯度提升决策树模型;将所述副本当前的叶子节点输出值确定为旧叶子节点输出值;在保持所述副本结构不变的情况下,根据所述新训练样本集合更新所述副本的叶子节点输出值,将更新后的叶子节点输出值确定为新叶子节点输出值;针对所述副本的每个叶子节点,计算对应的新叶子节点输出值和对应的旧叶子节点输出值的加权和,并将该叶子节点的输出值更新为所述加权和,得到新的副本树模型;将所述新的副本树模型部署到线上,所述新的副本树模型用于在预设情况下替换所述预设树模型。

    一种模型的训练方法、装置及设备

    公开(公告)号:CN114241268B

    公开(公告)日:2024-09-03

    申请号:CN202111574537.5

    申请日:2021-12-21

    Abstract: 本说明书实施例公开了一种模型的训练方法、装置及设备,该方法包括:获取第一数量的第一训练样本,然后,从所述第一数量的第一训练样本中选取第二数量的第一训练样本,并分别向第二数量的第一训练样本中加入相应的噪声数据,得到所述第二数量的第二训练样本,最终,可以基于剩余的第一训练样本和所述第二数量的第二训练样本,通过预设的基于梯度的对抗攻击算法对目标模型进行训练,得到训练后的目标模型。

    一种语言模型的训练方法、装置、设备及存储介质

    公开(公告)号:CN117313739A

    公开(公告)日:2023-12-29

    申请号:CN202311149563.2

    申请日:2023-09-06

    Abstract: 本申请公开了一种语言模型的训练方法、装置、设备及存储介质,通过确定预训练后的语言模型对应的待定模板,再对第一原始文本进行数据增强,得到增强文本,并将增强文本和待定模板进行组合后得到的第一组合结果输入语言模型中,得到增强文本的输出结果,最后再根据增强文本的输出结果和第一原始文本的标注之间的差距,来调整该语言模型对应的待定模板,以将调整完成的待定模板作为该语言模型匹配的目标模板。本申请通过对第一原始文本进行数据增强来确定增强文本,并通过增强文本对该语言模型对应的待定模板进行调整,使得该语言模型可通过调整完成的待定模板基于原始文本和增强文本都可准确执行自然语言处理任务,保证了语言模型的鲁棒性。

    一种数据处理方法、装置及设备
    19.
    发明公开

    公开(公告)号:CN116702131A

    公开(公告)日:2023-09-05

    申请号:CN202310648022.8

    申请日:2023-06-02

    Abstract: 本说明书实施例公开了一种数据处理方法、装置及设备,该方法包括:获取能够实现对目标模型进行迁移攻击的代理模型,以及所述代理模型的原始样本;对所述代理模型进行结构重参数化处理,得到重参数化代理模型和所述重参数化代理模型的第一模型权重;基于预设的优化搜索规则、所述重参数化代理模型和所述重参数化代理模型的第一模型权重,确定所述重参数化代理模型对应的对抗迁移性评估结果优于预设评估基准的第二模型权重,基于所述第二模型权重更新所述重参数化代理模型,得到更新后的代理模型;基于所述原始样本,通过所述更新后的代理模型,生成用于攻击所述目标模型的对抗样本。

    基于自合成的图像生成方法和系统

    公开(公告)号:CN116612057A

    公开(公告)日:2023-08-18

    申请号:CN202310608634.4

    申请日:2023-05-26

    Abstract: 本公开涉及基于自合成的图像生成方法和系统。该方法包括:对原始图像进行目标检测以确定感兴趣目标的边界框;确定所述边界框内的OCR内容;计算出能够包含所述OCR内容的最小边界框;选择掩模区域,所述掩模区域在所述感兴趣目标的边界框之内并且包含所述最小边界框;对所述掩模区域进行图像增强;以及将经图像增强的所述掩模区域混合到所述原始图像中,以得到自合成的图像。本公开还涉及一种用于交互式限流的系统和装置以及一种非瞬态处理器可读存储介质。

Patent Agency Ranking