数据处理方法、装置及设备
    11.
    发明公开

    公开(公告)号:CN118349901A

    公开(公告)日:2024-07-16

    申请号:CN202410527449.7

    申请日:2024-04-29

    Inventor: 刘芳卿

    Abstract: 本说明书实施例提供了一种数据处理方法、装置及设备,其中,方法包括:获取与历史业务数据对应的第一特征向量;通过业务处理模型的第一模块,对第一特征向量进行风险检测处理,确定历史业务数据对应的预测风险类型,并基于预测风险类型和目标风险类型,确定第一子损失值;基于预设分段维数,对第一特征向量进行表征分段映射处理得到的第二特征向量;基于第二特征向量,以及历史业务数据对应的目标风险类型,构建正样本对和负样本对,并基于业务处理模型的第二模块,以及正样本对和负样本对,确定第二子损失值;基于第一子损失值和第二子损失值,确定业务处理模型是否收敛,直到业务处理模型收敛,得到训练后的业务处理模型。

    一种模型训练的方法、装置、存储介质及电子设备

    公开(公告)号:CN117593003A

    公开(公告)日:2024-02-23

    申请号:CN202311631584.8

    申请日:2023-11-30

    Inventor: 刘芳卿

    Abstract: 本说明书公开了一种模型训练的方法、装置、存储介质及电子设备,先获取预训练的大语言模型以及样本用户。然后可确定样本用户对应的标注风险类型,在样本用户对应的各维度的用户数据中,确定标注维度的用户数据,标注维度的用户数据为导致样本用户的风险类型是标注风险类型的原因。可将样本用户对应的各维度的用户数据输入大语言模型,得到大语言模型输出的第一输出结果,第一输出结果包括:样本用户的预测风险类型以及预测维度的用户数据,预测维度的用户数据是导致样本用户的风险类型是预测风险类型的用户数据。最后根据第一输出结果、标注风险类型和标注维度的用户数据,执行第一训练任务,以对大语言模型进行训练。提高了大语言模型的性能。

    一种模型训练、业务风控方法、装置、设备及存储介质

    公开(公告)号:CN116957330A

    公开(公告)日:2023-10-27

    申请号:CN202310873158.9

    申请日:2023-07-14

    Inventor: 刘芳卿

    Abstract: 本说明书公开了一种模型训练、业务风控方法、装置、设备及存储介质,用于隐私保护,可以通过将风险预测模型的第一网络层的输出结果作为标签,对风险预测模型的第二网络层进行训练,从而可以使第二网络层学习到部分第一网络层的风险预测能力,进而可以在用户发起的待执行业务的信息有限的情况下,通过第二网络层对待执行业务进行风险预测,以提升风险预测的准确率。

    一种模型训练的方法、装置、存储介质及电子设备

    公开(公告)号:CN116663676A

    公开(公告)日:2023-08-29

    申请号:CN202310631919.X

    申请日:2023-05-30

    Inventor: 刘芳卿

    Abstract: 本说明书公开了一种模型训练的方法、装置、存储介质及电子设备,用于隐私保护,可以获取业务数据以及该业务数据所对应的标注信息,该业务数据中包括若干维度的数据;从该业务数据中确定出预设维度下的数据,而后,将该业务数据输入到预测模型中,以使预测模型输出针对该业务数据的预测结果,作为第一预测结果,以及将该业务数据中在该预设维度下的数据输入到该预测模型中,以使该预测模型基于该业务数据中在该预设维度下的数据得到第二预测结果,最后,以最小化该第一预测结果与标注信息之间的偏差,以及维持第一预测结果与第二预测结果之间的偏差位于预设偏差范围内为优化条件,对该预测模型进行训练,在一定程度上提高了模型预测的准确率。

    训练风险识别模型的方法、风险识别方法及对应装置

    公开(公告)号:CN115935265B

    公开(公告)日:2023-05-26

    申请号:CN202310224138.9

    申请日:2023-03-03

    Inventor: 刘芳卿

    Abstract: 本说明书实施例提供了一种训练风险识别模型的方法、风险识别方法及对应装置,涉及人工智能技术领域。本申请采用元学习的方式训练包含编码模块和第一预测模块的第一风险识别模型,基于第一事件样本的特征向量、第一训练样本的安全支持集以及各风险域的风险支持集中各事件的特征向量确定第一事件样本分别与安全支持集、各风险域的风险支持集的相关度,依据第一事件样本分别与安全支持集、各风险域的风险支持集的相关度预测第一事件样本的风险信息。通过这种方式将对多个风险域的学习统一到一个风险识别模型中,相比较针对不同风险域分别训练独立的风险识别模型的方式,减轻了对存储性能和计算性能所带来的压力。

    一种分类模型训练的方法、装置、存储介质及电子设备

    公开(公告)号:CN115828162A

    公开(公告)日:2023-03-21

    申请号:CN202310137411.4

    申请日:2023-02-08

    Abstract: 本说明书公开了一种分类模型训练的方法、装置、存储介质及电子设备,在本说明书提供的方法中,先获得每种模态类型的信息的单模态分类结果,作为第一分类结果,然后将各模态类型的信息输入待训练的多模态分类模型,确定各模态类型的信息的特征与各特征的融合特征,并根据融合特征确定所述训练样本的分类结果,作为第二结果,根据所述第一分类结果、第二分类结果、所述标注确定各模态类型对应的损失,根据各模态类型对应的损失确定共同损失,根据共同结果调整待训练的多模态分类模型的参数,得到训练后的多模态分类模型。从上述方法中可以看出,根据本方法训练得到的多模态分类模型能够准确的根据多模态类型的信息进行分类。

    一种模型的训练方法、装置及设备

    公开(公告)号:CN114429222A

    公开(公告)日:2022-05-03

    申请号:CN202210061986.8

    申请日:2022-01-19

    Abstract: 本说明书实施例公开了一种模型的训练方法、装置及设备,该方法包括:获取待训练的目标模型对应的模型参数和目标模型的训练样本,并将模型参数划分为多个不同的模型子参数,然后,可以基于训练样本和每个模型子参数对应的损失函数,对目标模型进行模型训练,确定每个模型子参数对应的初始梯度信息,基于每个模型子参数对应的截断信息对相应的模型子参数对应的初始梯度信息进行梯度截断,得到每个模型子参数对应的梯度信息,最终,可以向每个模型子参数对应的梯度信息中加入相应的噪声信息,得到每个模型子参数对应的目标梯度信息,并基于每个模型子参数对应的目标梯度信息对模型参数进行更新,得到训练后的目标模型。

    一种风控模型的训练方法、装置及可读存储介质

    公开(公告)号:CN118691072A

    公开(公告)日:2024-09-24

    申请号:CN202410705810.0

    申请日:2024-05-31

    Inventor: 刘芳卿 杨信

    Abstract: 本说明书公开了一种风控模型的训练方法、装置及可读存储介质,获取目标历史业务的业务数据和该业务数据对应的文本描述,作为目标历史业务的相关文本,根据其他历史业务的业务数据对应的文本描述,确定无关文本。将该目标历史业务的业务数据输入第一编码层,确定第一特征,将相关文本和无关文本,分别输入第二编码层,确定第二特征以及第三特征。基于第一特征与第二特征之间的第一差异,以及第一特征与第三特征之间的第二差异,训练第一编码层。根据训练完成的第一编码层和大语言模型的解码层,构建风控模型,从而可直接基于第一编码层对非文本业务数据编码的第一特征,输出风控文本,不再需要对业务数据进行文本转换,提高了风控效率。

    一种多任务学习方法、装置、存储介质及电子设备

    公开(公告)号:CN117633644A

    公开(公告)日:2024-03-01

    申请号:CN202311008843.1

    申请日:2023-08-10

    Inventor: 刘芳卿

    Abstract: 本说明书公开了一种多任务学习方法、装置、存储介质及电子设备。在本说明书提供的多任务学习方法中,获取样本数据以及所述样本数据在各子任务下的标注;在所述样本数据中选择若干候选数据;对选择的各候选数据进行融合,得到虚拟样本数据;针对每个子任务,将各候选数据在该子任务下的标注融合,得到所述虚拟样本数据在该子任务下的标注;采用所述虚拟样本数据以及所述虚拟样本数据在每个子任务下的标注,对目标模型进行训练。

    风控场景中消除噪声样本的方法和装置

    公开(公告)号:CN116628572A

    公开(公告)日:2023-08-22

    申请号:CN202310577209.3

    申请日:2023-05-18

    Abstract: 本说明书实施例提供了一种风控场景中消除噪声样本的方法和装置。该方法包括:得到原始训练样本集;该原始训练样本集中包括扩充训练样本以及干净训练样本;将原始训练样本集中的一部分训练样本输入第一去噪模型中,另一部分训练样本输入第二去噪模型中;从输入一个去噪模型的各训练样本中确定出标签相对可靠的训练样本,并利用输入该标签相对可靠的训练样本时得到的该去噪模型的梯度信息更新另一个去噪模型的参数;最终得到的去噪模型对所述原始训练样本集中的训练样本进行分类,利用分类结果更新原始训练样本集中该训练样本的标签,从而得到消除噪声样本后的训练样本集。本说明书实施例能够更好地消除噪声样本。

Patent Agency Ranking