数据处理方法、装置及设备
    1.
    发明公开

    公开(公告)号:CN116308375A

    公开(公告)日:2023-06-23

    申请号:CN202211591302.1

    申请日:2022-12-12

    Inventor: 欧建永 刘琼 周杭

    Abstract: 本说明书实施例提供了一种数据处理方法、装置及设备,所述方法包括:获取待检测的目标图结构数据,所述目标图结构数据基于人机交互数据构建;基于预设力导向布局模型,确定所述目标图结构数据中每个节点的布局位置信息,所述力导向布局模型通过确定所述目标图结构数据中每两个节点之间的排斥力和/吸引力,移动所述目标图结构数据中的节点,以得到所述目标图结构数据中每个节点的布局位置信息;基于所述目标图结构数据中每个节点的布局位置信息,对所述目标图结构数据中的节点进行聚类处理,得到聚类结果,以基于所述聚类结果进行风险检测。

    一种业务执行方法、装置、设备及可读存储介质

    公开(公告)号:CN118069248A

    公开(公告)日:2024-05-24

    申请号:CN202410161353.3

    申请日:2024-02-04

    Abstract: 本说明书公开了一种业务执行方法、装置、设备及可读存储介质,以获取的各业务对象为节点确定目标拓扑图,获取各业务对象的行为序列,针对目标拓扑图中每个节点,根据该节点的行为序列和该节点的邻居节点的行为序列,确定该节点与该节点的邻居节点之间的关系权重,根据该节点的邻居节点的特征、该节点的邻居节点的行为序列和关系权重,对该节点的特征进行更新,得到该节点的目标特征,根据目标拓扑图中各节点的目标特征执行业务。可见,通过在邻居关系、传播特征提取和节点特征更新进行行为序列和图数据的信息交互和融合,有效地整合了行为序列的特征和图数据的特征,从而提高下游业务的执行效果和数据的隐私安全性。

    一种风控模型的预训练方法、装置、存储介质及电子设备

    公开(公告)号:CN117251730A

    公开(公告)日:2023-12-19

    申请号:CN202311176867.8

    申请日:2023-09-12

    Abstract: 本说明书公开了一种风控模型的预训练方法、装置、存储介质及电子设备,在对风控模型进行预训练时,可获取风控样本,将风控样本分别输入待训练的风控模型的各编码端,得到各编码端输出的各编码结果。根据各编码结果和预训练任务,确定各编码端对应的损失,根据确定出的各编码端对应的损失,确定各编码端的损失权重。根据各编码端的损失权重,对各编码端对应的损失进行加权,得到最终损失,根据最终损失,对待训练的风控模型中的各编码端进行训练。在对风控模型进行多任务预训练时,根据每个任务对应的编码端的损失,确定各编码端损失的权重,从而得到最终损失,平衡了训练风控模型时各训练任务的损失收敛速度,使得各训练任务可在相同时刻收敛。

    一种风险检测的方法、装置、存储介质及电子设备

    公开(公告)号:CN116776114A

    公开(公告)日:2023-09-19

    申请号:CN202310401375.8

    申请日:2023-04-13

    Abstract: 本说明书公开了一种风险检测的方法、装置、存储介质及电子设备。该风险检测的方法用于隐私保护,包括:获取第一业务数据,确定第一业务数据对应的原始特征,对第一业务数据中部分维度的数据进行掩码处理,得到掩码后数据,通过预设的风控模型的特征提取网络对掩码后数据进行处理,以确定掩码后数据对应的目标特征,将掩码后数据对应的目标特征输入风控模型的特征重构网络,得到重构特征,以最小化原始特征与重构特征之间的偏差为优化目标,至少对风控模型中的特征提取网络进行训练,将训练完成的风控模型进行部署,并在接收到业务请求后,将业务请求对应的目标业务数据输入部署后的风控模型中,以通过风控模型执行风险检测。

    一种模型的处理方法、装置及设备

    公开(公告)号:CN116596645A

    公开(公告)日:2023-08-15

    申请号:CN202310495360.2

    申请日:2023-04-26

    Abstract: 本说明书实施例公开了一种模型的处理方法、装置及设备,该方法包括:获取源域的第一样本数据,构建与第一样本数据具有相同维度的替换样本数据,第一样本数据不存在标签信息,第一样本数据基于预设的表格数据构建,然后,基于第一样本数据和替换样本数据,通过预设的概率分布函数,生成相应的正负样本对,之后,基于第一样本数据和正负样本对中的样本数据对源域的第一模型进行模型训练,第一模型与目标域的第二模型中包括能够进行参数共享的目标子模型,最终,将训练后的第一模型中的目标子模型的模型参数与第二模型中的目标子模型的模型参数进行参数共享,并在此基础上,通过目标域的第二样本数据对第二模型进行有监督的模型训练。

    一种数据的处理方法、装置及设备

    公开(公告)号:CN118691281A

    公开(公告)日:2024-09-24

    申请号:CN202410693321.8

    申请日:2024-05-30

    Abstract: 本说明书实施例公开了一种数据的处理方法、装置及设备,该方法包括:获取执行目标事件所产生的历史环境信息,所述历史环境信息中包括用户标识和媒介信息,基于所述历史环境信息获取用户执行所述目标事件的过程中用户与所述媒介信息之间的关联关系,基于用户与所述媒介信息之间的关联关系,通过所述媒介信息构建不同用户之间的用户关系图谱,并基于用户与所述媒介信息之间的关联关系为所述用户关系图谱中相互连接的用户对生成用户对权重,基于所述用户关系图谱和所述用户对权重对所述用户关系图谱进行群组挖掘处理,得到由不同用户之间的关联关系构成的一个或多个不同的群组。

    大模型预训练方法及装置
    7.
    发明公开

    公开(公告)号:CN117252250A

    公开(公告)日:2023-12-19

    申请号:CN202311176837.7

    申请日:2023-09-12

    Abstract: 本说明书一个或多个实施例公开了一种大模型预训练方法及装置。首先通过大模型的第一输入通道获取第一模态数据集,并通过大模型的第二输入通道获取第二模态数据集;然后将第一模态数据集中的模态数据输入到大模型中的第一编码器,得到第一表征信息,将第二模态数据集中包含的多种模态数据分别输入到大模型中的第二编码器,并将第二模态数据集对应第二编码器的输出结果进行表征融合处理,得到第二表征信息;最后将第一表征信息和第二表征信息映射到预设的特征空间,并基于特征空间的映射信息和预设的对比学习损失函数对大模型进行对比学习训练,得到预训练后的大模型,对比学习损失函数基于实体之间的表征相似性确定。

    一种模型的处理方法、装置及设备

    公开(公告)号:CN117093863A

    公开(公告)日:2023-11-21

    申请号:CN202311007524.9

    申请日:2023-08-10

    Abstract: 本说明书实施例公开了一种模型的处理方法、装置及设备,该方法包括:获取用于训练目标模型的第一样本数据和第二样本数据,第一样本数据的第一标签信息的准确度高于第二样本数据的第二标签信息的准确度;基于第一样本数据、第二样本数据、目标模型对应的业务的信息、第一标签信息和第二标签信息,对预训练的样本权重模型进行模型训练,得到训练后的样本权重模型;基于第二样本数据和第二标签信息,通过训练后的样本权重模型确定第二样本数据的置信度;基于第二样本数据、第二标签信息和第二样本数据的置信度,对目标模型进行模型训练,得到训练后的目标模型。

    风险挖掘方法及对应装置
    9.
    发明公开

    公开(公告)号:CN115687905A

    公开(公告)日:2023-02-03

    申请号:CN202211369410.4

    申请日:2022-11-03

    Inventor: 欧建永 王玥

    Abstract: 本说明书实施例提供了一种风险挖掘方法及对应装置,涉及机器学习技术领域。其中方法包括:获取待检测对象的N个网络行为特征的取值,所述N为大于1的正整数;将所述待检测对象的N个网络行为特征的取值输入自编码模型,获取所述自编码模型输出的所述N个网络行为特征的预测值,其中所述自编码模型利用风险等级低于预设阈值的对象的所述N个网络行为特征预先训练得到;利用所述N个网络行为特征的取值和预测值的差异程度,确定所述待检测对象的异常分值;利用所述待检测对象的异常分值,得到所述待检测对象的风险信息。通过本申请能够提高风险挖掘的准确率。

    一种语言模型的预训练方法、装置、介质及电子设备

    公开(公告)号:CN118690848A

    公开(公告)日:2024-09-24

    申请号:CN202410703975.4

    申请日:2024-05-31

    Abstract: 本说明书公开了一种语言模型的预训练方法、装置、介质及电子设备,可获取第一样本文本,第一样本文本为结构化文本,并提取第一样本文本中的各字段。针对提取出的每个字段,根据该字段的属性以及属性值,确定该字段对应的标识符,并根据确定出的各字段对应的标识符,得到第一样本文本对应的标识符序列。将标识符序列输入语言模型,得到标识符序列对应的文本特征,以根据文本特征以及预设的训练任务,对语言模型中的编码端进行预训练。通过使用标识符去对结构化文本中的字段进行替换,进而使用结构化文本对应的标识符序列去训练语言模型,使得训练得到的语言模型可以学习到结构化文本中的特征的关联关系以及潜在关系,提高了语言模型的准确度。

Patent Agency Ranking