样本生成方法和装置
    71.
    发明公开

    公开(公告)号:CN113780365A

    公开(公告)日:2021-12-10

    申请号:CN202110952742.4

    申请日:2021-08-19

    Abstract: 本说明书实施例提供了一种样本生成方法及装置。该方法首先得到结构化数据的目标样本;所述目标样本中包括至少一个特征值,每一个特征值对应所述结构化数据的一个特征;从所述结构化数据的至少一个特征中,确定待扰动特征;确定对应于所述待扰动特征的扰动范围;在所述扰动范围内,对所述目标样本中的对应于待扰动特征的特征值进行扰动,以得到新的样本。

    一种数据处理方法、装置及设备

    公开(公告)号:CN113672709A

    公开(公告)日:2021-11-19

    申请号:CN202110886944.3

    申请日:2021-08-03

    Abstract: 本说明书实施例提供了一种数据处理方法、装置及设备,包括:接收针对目标业务的第一数据处理请求,其中,第一数据处理请求中携带有终端设备的地址信息,第一数据处理请求为对用户输入的针对目标业务的待验证信息进行验证的处理请求;向终端设备发送第一提示信息,以使用户基于第一提示信息输入与目标业务对应的待验证信息;接收终端设备发送的待验证信息,采用预先训练的预设验证模型对待验证信息进行验证,并基于验证结果执行目标业务,预先训练的预设验证模型为基于样本验证信息所对应的信息内容权重进行有监督的训练得到的。

    一种风险识别模型的确定方法及装置

    公开(公告)号:CN113313575A

    公开(公告)日:2021-08-27

    申请号:CN202110640452.6

    申请日:2021-06-08

    Abstract: 本说明书一个或多个实施例提供了一种风险识别模型的确定方法及装置,其中,该方法包括:获取目标业务对应的模型训练样本数据和针对目标业务所配置的风控策略信息;基于该模型训练样本数据和用于风险识别的分类模型,对各风控策略信息对应的策略权重进行更新,得到更新后的策略权重;基于该模型训练样本数据和更新后的策略权重,对该分类模型的模型参数进行更新,得到更新后的分类模型;若更新后的分类模型满足预设模型优化终止条件,则将该更新后的分类模型确定为训练后的风险识别模型;若更新后的分类模型不满足预设模型优化终止条件,则将该分类模型作为下一轮策略权重更新所用的用于风险识别的分类模型。

    基于事件序列进行业务预测的方法、神经网络模型和装置

    公开(公告)号:CN113255908A

    公开(公告)日:2021-08-13

    申请号:CN202110584259.5

    申请日:2021-05-27

    Inventor: 李辉 傅幸 王维强

    Abstract: 本说明书实施例提供一种基于事件序列进行业务预测的方法和神经网络模型。在该方法中,首先获取目标事件序列,其中包含τ个事件;事件的类别型字段的备选类别值被视为实体。然后确定单个事件对应的事件嵌入向量;τ个事件的事件嵌入向量构成嵌入矩阵。接着,利用分配矩阵对嵌入矩阵进行线性变换,基于线性变换结果得到实体表征矩阵;其中,分配矩阵指示各事件对各实体的包含关系。进一步的,对实体表征矩阵中对应于同一字段的矩阵部分进行池化操作,得到该字段对应的字段表征向量;再基于各字段表征向量,确定目标事件序列对应的条件嵌入向量。从而至少基于该条件嵌入向量,确定目标事件序列对应的序列表征向量,用于进行与事件相关的业务预测。

    对事件特征进行编码的方法和装置

    公开(公告)号:CN113220947A

    公开(公告)日:2021-08-06

    申请号:CN202110587005.9

    申请日:2021-05-27

    Inventor: 李辉 傅幸 王维强

    Abstract: 本说明书实施例提供一种对事件特征进行编码的方法和装置。根据该方法,对于事件中多种不同类型、不同数据结构的特征项,采用不同的方式进行编码。特别是对于类别型特征项,当确定当前目标事件针对该特征项的特征值属于针对该特征项确定的低频取值集合时,根据用于指示该低频取值集合的预定值,对该特征项编码。如此,可以将该特征项下的不同低频取值合并为一个统一的预定值,从而缩减编码维度,优化编码效果。

    更新事件评估模型的方法及装置

    公开(公告)号:CN111275350B

    公开(公告)日:2021-06-04

    申请号:CN202010083148.1

    申请日:2020-02-08

    Abstract: 本说明书实施例提供一种事件评估模型的训练方法和装置。该事件评估模型包括宽度部分和深度部分,宽度部分模型参数少,用于处理事件的可解释性特征数据;深度部分模型参数多,用于处理与事件相关联的抽象特征数据。训练方法包括,收集较短时间周期中的样本事件,获取短期样本集;将短期样本集中的样本事件输入事件评估模型,根据预测结果和对应的类别标签,确定短期预测损失,根据该短期预测损失,更新宽度部分。收集较长时间周期中的样本事件,获取长期样本集,将其中各个样本事件输入事件评估模型,根据预测结果和对应的类别标签,确定长期预测损失;并根据该长期预测损失,更新深度部分。

    保护隐私安全的多方联合进行特征评估的方法及装置

    公开(公告)号:CN110990857B

    公开(公告)日:2021-04-06

    申请号:CN201911269227.5

    申请日:2019-12-11

    Abstract: 本说明书实施例提供了保护隐私安全的多方联合进行特征评估的方法和装置。该多方至少包括存储有第一样本集的第一设备和存储有第二样本集的第二设备,该方法应用于第一设备;该方法包括:对第一样本集中各样本的初始ID进行加密,并将得到的第一样本集的第一次加密ID和标签发送给第二设备;从第二设备接收第二样本集的第一次加密ID和所在分箱的标识,以及第一样本集的第二次加密ID和标签;对第二样本集的第一次加密ID进行加密,得到第二样本集的第二次加密ID;根据第二样本集的第二次加密ID和第一样本集的第二加密ID确定共有样本;根据共有样本的标签、所在分箱的标识计算特征的信息价值,以针对机器学习模型进行特征选择。

    基于零知识证明的个人数据处理方法、装置及电子设备

    公开(公告)号:CN111310234B

    公开(公告)日:2020-11-03

    申请号:CN202010387119.4

    申请日:2020-05-09

    Abstract: 本说明书实施例公开了一种基于零知识证明的个人数据处理方法、装置及电子设备,在基于零知识证明的个人数据处理方法中,代表服务提供方的第一智能体向代表目标用户的第二智能体发送预设问题;第二智能体查询目标用户的个人数据库得到预设问题的答案,通过零知识证明算法生成包含所述答案的证明并发送至第一智能体;第一智能体基于所述零知识证明算法验证所述证明的正确性,并在验证正确后从所述证明中获取所述预设问题的答案,最后将所述预设问题和所述预设问题的答案确定为用于建模的特征。

    可信关系的识别方法、装置、存储介质和计算机设备

    公开(公告)号:CN111476668B

    公开(公告)日:2020-10-13

    申请号:CN202010585710.0

    申请日:2020-06-24

    Abstract: 本说明书实施例提供了一种可信关系的识别方法、装置、存储介质和计算机设备。该方法包括:获取用户的行为数据,行为数据包括目标主体的主体特征和多个对象主体的主体特征;根据目标主体的主体特征和多个对象主体的主体特征,利用预先训练的图神经网络模型,生成目标主体对应的第一节点嵌入向量和多个对象主体对应的第二节点嵌入向量;根据第一节点嵌入向量和各个第二节点嵌入向量,生成目标主体与各个对象主体之间的向量距离;判断多个向量距离是否均大于或等于设定阈值;若判断出多个向量距离中至少一个向量距离小于设定阈值,将小于设定阈值的向量距离对应的第一节点嵌入向量和第二节点嵌入向量,确定为可信关系对。

    一种数据融合方法、装置及设备

    公开(公告)号:CN111538794A

    公开(公告)日:2020-08-14

    申请号:CN202010334175.1

    申请日:2020-04-24

    Abstract: 本说明书实施例公开了一种数据融合方法、装置及设备。方案包括:获取第一数据集中的第一实体数据的第一基础数据;获取第二数据集中的第二实体数据的第二基础数据;基于所述第一基础数据和所述第二基础数据判断所述第一实体与所述第二实体是否为同一行为实体,得到判断结果;当所述判断结果表示所述第一实体与所述第二实体为同一行为实体时,将所述第一实体数据和所述第二实体数据合并为第三实体数据,所述第三实体数据用于描述所述行为实体,所述第三实体数据中包含的基础数据的信息大于所述第一实体数据,且大于所述第二实体数据。

Patent Agency Ranking