对表格数据和序列数据融合处理的方法和装置

    公开(公告)号:CN116578579A

    公开(公告)日:2023-08-11

    申请号:CN202310500448.9

    申请日:2023-05-04

    Abstract: 本说明书实施例提供一种对表格数据和序列数据融合处理的方法和装置。方法包括:将表格数据输入表格编码器,得到表格嵌入向量;将序列数据输入序列编码器,得到初始嵌入矩阵,序列数据包括与目标对象相关、按照时序排列的t个事件的事件数据,初始嵌入矩阵由t个事件分别对应的初始事件嵌入向量按照时序排列而成;将表格嵌入向量和初始嵌入矩阵进行目标拼接处理,得到拼接嵌入矩阵;拼接嵌入矩阵由m个事件分别对应的拼接事件嵌入向量按照时序排列而成;将拼接嵌入矩阵输入自注意力层,得到融合嵌入矩阵;融合嵌入矩阵用于对目标对象进行检索或分类。能够使得对目标对象进行检索或分类取得良好的效果。

    数据处理方法、装置及设备
    52.
    发明公开

    公开(公告)号:CN116186540A

    公开(公告)日:2023-05-30

    申请号:CN202310197133.1

    申请日:2023-02-23

    Abstract: 本说明书实施例提供了一种数据处理方法、装置及设备,其中,该方法包括:获取用于训练目标模型的数据样本;将数据样本输入目标模型的第一模块,得到数据样本对应的第一分类标签以及数据样本对应的第一表征向量;基于第一表征向量和预设类别表征向量的相似度,确定数据样本对应的第二分类标签,并基于第二分类标签、第一分类标签和预设分类损失函数,得到第一损失值;将数据样本输入目标模型的第二模块,得到数据样本对应的第二表征向量,并基于第一表征向量、第二表征向量和预设对比损失函数,得到第二损失值;基于第一损失值和第二损失值,对目标模型进行迭代训练,得到训练后的目标模型。

    数据处理方法、装置及设备

    公开(公告)号:CN115712866B

    公开(公告)日:2023-05-02

    申请号:CN202211336111.0

    申请日:2022-10-28

    Inventor: 蒋晨之 傅幸

    Abstract: 本说明书实施例提供了一种数据处理方法、装置及设备,所述方法包括:获取与目标指标对应的待训练的目标风险控制模型,并获取与所述目标指标对应的历史业务数据,以及所述历史业务数据对应的标注风险类型;将所述历史业务数据输入所述待训练的目标风险控制模型,得到所述历史业务数据对应不同预测风险类型的风险概率;基于所述历史业务数据对应的标注风险类型、所述历史业务数据对应不同预测风险类型的风险概率和第一损失函数,确定所述目标风险控制模型是否收敛,若所述目标风险控制模型未收敛,则基于所述历史业务数据继续对所述目标风险控制模型进行训练,直至所述目标风险控制模型收敛,得到训练后的目标风险控制模型。

    样本不平衡场景下的样本增量、模型训练方法及装置

    公开(公告)号:CN115545124B

    公开(公告)日:2023-04-18

    申请号:CN202211507937.9

    申请日:2022-11-29

    Abstract: 本说明书实施例提供了一种样本不平衡场景下的样本增量、模型训练方法及装置。其中,用户样本集包括高风险用户样本和低风险用户样本及其类别标签,高风险用户样本属于小样本。在该方法中,从用户样本集中按照不偏向高风险用户样本的方式确定观测用户样本,从用户样本集中按照偏向高风险用户样本的方式对样本抽样,得到抽样用户样本;基于风控场景中高风险用户数量小于低风险用户数量的风险用户特点,确定第一数量占比,以第一数量占比为平均值确定符合风险用户特点的第一概率分布,按照第一概率分布确定属于观测用户样本的第一因子。这样,基于第一因子、观测用户样本与抽样用户样本及其相应的样本标签,确定插值用户样本以及对应的插值标签。

    一种异常检测方法、装置、可读存储介质及电子设备

    公开(公告)号:CN115964669A

    公开(公告)日:2023-04-14

    申请号:CN202211611448.8

    申请日:2022-12-13

    Abstract: 本说明书公开了一种异常检测方法、装置、可读存储介质及电子设备,通过针对每个大类,将该大类对应的历史行为数据输入异常检测模型中,得到该异常检测模型输出的该异常大类的每个异常子类的表征特征。在获取到待检测的用户行为数据后,将用户行为数据输入该异常检测模型中,根据用户行为数据对应的用户特征和预存的各异常大类包含的各异常子类的表征特征之间的相似度,确定该用户特征所对应的异常大类,并将该异常大类作为用户行为数据的异常检测结果。本方法可仅基于各异常大类分别对应的各异常子类和用户特征之间的相似度来确定异常检测结果,避免了对计算资源过大要求的同时,还能保证异常检测的准确性。

    数据处理方法、装置及设备

    公开(公告)号:CN115712866A

    公开(公告)日:2023-02-24

    申请号:CN202211336111.0

    申请日:2022-10-28

    Inventor: 蒋晨之 傅幸

    Abstract: 本说明书实施例提供了一种数据处理方法、装置及设备,所述方法包括:获取与目标指标对应的待训练的目标风险控制模型,并获取与所述目标指标对应的历史业务数据,以及所述历史业务数据对应的标注风险类型;将所述历史业务数据输入所述待训练的目标风险控制模型,得到所述历史业务数据对应不同预测风险类型的风险概率;基于所述历史业务数据对应的标注风险类型、所述历史业务数据对应不同预测风险类型的风险概率和第一损失函数,确定所述目标风险控制模型是否收敛,若所述目标风险控制模型未收敛,则基于所述历史业务数据继续对所述目标风险控制模型进行训练,直至所述目标风险控制模型收敛,得到训练后的目标风险控制模型。

    一种风险识别模型的训练方法、装置、设备及存储介质

    公开(公告)号:CN115600106A

    公开(公告)日:2023-01-13

    申请号:CN202211276933.4

    申请日:2022-10-18

    Abstract: 本说明书公开了一种风险识别模型的训练方法、装置、设备及存储介质,将训练样本输入待训练的风险识别模型,通过特征子网得到训练样本的第一特征,根据全连接层中的各参数对第一特征进行线性变换得到第二特征,通过分类子网得到训练样本的分类结果。以训练样本的标签以及分类结果之间的差异最小化,以及全连接层的各参数之间的相似性的最大化为训练目标,训练风险识别模型。可见,通过在训练目标中增加全连接层的各参数之间的相似性的最大化,能够使得训练后的风险识别模型不仅能够直接输出事件的风险类型,还可以通过表征子网输出的事件的特征适应于基于数据库的特征检索,扩展了风险识别的应用场景,提高了风险识别的准确性以及隐私的保护性。

    数据分类模型的训练方法、数据分类方法和装置

    公开(公告)号:CN114692724A

    公开(公告)日:2022-07-01

    申请号:CN202210208136.6

    申请日:2022-03-03

    Abstract: 本说明书实施例描述了数据分类模型的训练方法、数据分类方法和装置。根据实施例的方法,首先获取标签已知的正数据样本和标签未知的灰度数据样本,然后分别确定基于该正数据样本的标准正数据概率分布和基于该灰度数据样本的拟合正数据概率分布。进一步即可根据该标准正数据概率分布和拟合正数据概率分布实现对数据分类模型的训练。如此基于灰度数据中的正数据也应服从标准正数据概率分布的原则,构建适用于对所有数据进行标签分类的数据分类模型,从而能够提高利用该数据分类模型对数据进行分类的准确性。

    风险识别模型的训练方法、交易风险确定方法及装置

    公开(公告)号:CN114092097A

    公开(公告)日:2022-02-25

    申请号:CN202111396497.X

    申请日:2021-11-23

    Abstract: 本说明书一个或多个实施例涉及数据处理技术领域,尤其涉及一种风险识别模型的训练方法、交易风险确定方法及装置。该方法包括:获取训练样本,训练样本包括第一交易的意愿标签、风险标签以及多个特征;将多个特征输入风险识别模型进行预测处理,预测处理包括,在特征处理网络,对多个特征进行特征交叉处理,得到表征向量;在第一识别层,基于对表征向量的第一处理结果,确定第一交易的意愿度;在第二识别层,基于对表征向量的第二处理结果,确定第一交易的风险度;在预测损失减小的方向,更新风险识别模型的参数,其中预测损失包括第一损失和第二损失,第一损失基于意愿度和意愿标签确定,第二损失基于风险度和风险标签确定。

Patent Agency Ranking