一种对抗训练的方法及装置
    1.
    发明公开

    公开(公告)号:CN117540791A

    公开(公告)日:2024-02-09

    申请号:CN202410013557.2

    申请日:2024-01-03

    Abstract: 本说明书实施例涉及一种对抗训练的方法及装置,方法包括:首先,获取基于训练集训练的第一模型,训练集中各训练样本包含结构化的特征数据及标签。然后,基于第一模型针对各个训练样本的总预测损失对特征数据的梯度值,确定目标权重向量。接下来,将目标权重向量施加于各训练样本的特征数据,得到各第一结果向量,并构建检索集。最后,基于训练集和检索集对第二模型进行多轮训练;任意一轮训练包括:使用训练集中部分训练样本训练第二模型;基于对抗训练算法与第二模型,确定部分训练样本对应的对抗样本特征;利用对抗样本特征在检索集中进行检索,从而确定各个对抗样本特征的标签,并构建对抗训练集;使用对抗训练集训练第二模型。

    一种模型训练的方法、装置、存储介质及电子设备

    公开(公告)号:CN115618964A

    公开(公告)日:2023-01-17

    申请号:CN202211320460.3

    申请日:2022-10-26

    Abstract: 本说明书公开了一种模型训练的方法、装置、存储介质及电子设备。该模型训练的方法包括:获取样本数据,将所述样本数据输入待训练的数据处理模型中,得到各候选处理结果,以及每个候选处理结果对应的概率,从所述各候选处理结果中确定与所述样本数据对应的标签信息不匹配的目标结果,根据每个目标结果对应的概率,确定每个目标结果对应的权重,根据每个候选处理结果对应的概率以及所述权重,确定损失值,并根据所述损失值,对所述数据处理模型进行训练。

    利用博弈论更新推荐模型的方法及装置

    公开(公告)号:CN112149824B

    公开(公告)日:2022-07-22

    申请号:CN202010968311.2

    申请日:2020-09-15

    Abstract: 本说明书实施例提供一种更新推荐模型的方法和装置,其中推荐模型包括通过强化学习实现的智能体。方法包括:获取针对目标用户的当前推荐状态,将其输入智能体,智能体根据推荐策略,从备选动作集中确定针对目标用户的推荐动作。其中,推荐策略通过策略参数进行表征。然后,确定在执行上述推荐动作的情况下,按照推荐策略进行推荐的期望收益,作为第一收益;确定在推荐策略下,执行所有备选动作的预期平均收益,作为第二收益;并且,基于第一收益与第二收益的差值,确定执行推荐动作的遗憾度表示。根据上述遗憾度表示,确定对策略参数的更新梯度;于是根据更新梯度,更新智能体中的推荐策略。

    一种可信关系识别方法、装置及设备

    公开(公告)号:CN111080304B

    公开(公告)日:2022-06-03

    申请号:CN201911274061.6

    申请日:2019-12-12

    Abstract: 本说明书实施例提供一种可信关系识别方法、装置及设备。方案包括:获取发生交易行为的不同类型的待识别实体在关联关系拓扑图中的图结构特征,其中,图结构特征包括待识别实体的图关系特征以及待识别实体的节点属性特征,关联关系拓扑图是根据包括待识别实体在内的多个实体预先进行处理得到的;将图结构特征输入预先训练完成的图神经网络模型中,图神经网络模型会输出相应的分数,当所述输出数值大于或等于参考数值时,可以确定所述待识别实体之间的关系为可信关系。

    利用博弈论更新推荐模型的方法及装置

    公开(公告)号:CN112149824A

    公开(公告)日:2020-12-29

    申请号:CN202010968311.2

    申请日:2020-09-15

    Abstract: 本说明书实施例提供一种更新推荐模型的方法和装置,其中推荐模型包括通过强化学习实现的智能体。方法包括:获取针对目标用户的当前推荐状态,将其输入智能体,智能体根据推荐策略,从备选动作集中确定针对目标用户的推荐动作。其中,推荐策略通过策略参数进行表征。然后,确定在执行上述推荐动作的情况下,按照推荐策略进行推荐的期望收益,作为第一收益;确定在推荐策略下,执行所有备选动作的预期平均收益,作为第二收益;并且,基于第一收益与第二收益的差值,确定执行推荐动作的遗憾度表示。根据上述遗憾度表示,确定对策略参数的更新梯度;于是根据更新梯度,更新智能体中的推荐策略。

    基于零知识证明的个人数据处理方法、装置及电子设备

    公开(公告)号:CN111310234A

    公开(公告)日:2020-06-19

    申请号:CN202010387119.4

    申请日:2020-05-09

    Abstract: 本说明书实施例公开了一种基于零知识证明的个人数据处理方法、装置及电子设备,在基于零知识证明的个人数据处理方法中,代表服务提供方的第一智能体向代表目标用户的第二智能体发送预设问题;第二智能体查询目标用户的个人数据库得到预设问题的答案,通过零知识证明算法生成包含所述答案的证明并发送至第一智能体;第一智能体基于所述零知识证明算法验证所述证明的正确性,并在验证正确后从所述证明中获取所述预设问题的答案,最后将所述预设问题和所述预设问题的答案确定为用于建模的特征。

    业务处理方法、业务处理装置、电子设备及存储介质

    公开(公告)号:CN111263351A

    公开(公告)日:2020-06-09

    申请号:CN202010021100.8

    申请日:2020-01-09

    Abstract: 本说明书涉及一种业务处理方法。该方法从用户数据中提取移动终端号码,得到移动终端号码集合;通过二次放号判别模型,基于移动终端号码集合以及与各移动终端号码对应的用户行为数据,确定各移动终端号码是否为二次放号的移动终端号码;从移动终端号码集合中删除二次放号的移动终端号码;提取各移动终端号码的区域标识以及在用户数据中首次出现的时间信息;根据各个移动终端号码的区域标识及时间信息确定各移动终端号码对应的属性值;以及响应于一业务请求,获取业务请求中的移动终端号码,并根据获取的移动终端号码对应的属性值或者是否标注为二次放号对业务请求进行处理。本说明书还提供了业务处理装置、电子设备以及存储介质。

    策略选择优化方法以及装置

    公开(公告)号:CN110929960A

    公开(公告)日:2020-03-27

    申请号:CN201911272217.7

    申请日:2019-12-12

    Inventor: 张震 金宏 王维强

    Abstract: 本说明书实施例提供策略选择优化方法以及装置,其中所述策略选择优化方法包括:根据业务中多个业务指标的权重确定目标函数以及约束条件,根据所述业务选择群体优化算法,并根据权重最大的业务指标对应的多个策略初始化策略群,再根据策略群中的多个策略组合构建与所述多个策略组合对应的样本向量;通过将样本向量输入目标函数和约束条件后获取的输出结果筛选策略群的群体最优解,根据所述群体最优解,利用群体优化算法并通过迭代的方式对所述策略群进行优化;在迭代完成的情况下,在迭代完成后获得的目标策略群中筛选所述业务的最优策略组合。

    一种对抗训练的方法及装置

    公开(公告)号:CN117540791B

    公开(公告)日:2024-04-05

    申请号:CN202410013557.2

    申请日:2024-01-03

    Abstract: 本说明书实施例涉及一种对抗训练的方法及装置,方法包括:首先,获取基于训练集训练的第一模型,训练集中各训练样本包含结构化的特征数据及标签。然后,基于第一模型针对各个训练样本的总预测损失对特征数据的梯度值,确定目标权重向量。接下来,将目标权重向量施加于各训练样本的特征数据,得到各第一结果向量,并构建检索集。最后,基于训练集和检索集对第二模型进行多轮训练;任意一轮训练包括:使用训练集中部分训练样本训练第二模型;基于对抗训练算法与第二模型,确定部分训练样本对应的对抗样本特征;利用对抗样本特征在检索集中进行检索,从而确定各个对抗样本特征的标签,并构建对抗训练集;使用对抗训练集训练第二模型。

Patent Agency Ranking