图谱表征系统的训练方法及装置

    公开(公告)号:CN112559640A

    公开(公告)日:2021-03-26

    申请号:CN202011409591.X

    申请日:2020-12-06

    Abstract: 本说明书实施例提供一种图谱表征系统的训练方法,该图谱表征系统包括图神经网络、多个节点级学习向量、多个中间级学习向量和多个图谱级学习向量。该方法包括:先获取第一训练样本,其中包含对应的两个关系图谱和相似度标签值,任一的第一关系图谱包括多个对象节点;接着,利用图神经网络对第一关系图谱进行图嵌入处理,得到多个对象节点嵌入向量;然后,基于该多个对象节点嵌入向量,依次利用节点相似记忆组件、节点‑图谱相似记忆组件和图谱相似记忆组件,提取不同尺度的信息,从而得到第一关系图谱的绝对化的图谱表征向量;再接着,计算对应两个关系图谱的两个图谱表征向量之间的相似度预测值,并结合相似度标签值,训练上述图谱表征系统。

    一种多模态数据的融合方法、装置及设备

    公开(公告)号:CN118260713A

    公开(公告)日:2024-06-28

    申请号:CN202410384289.5

    申请日:2024-03-29

    Abstract: 本说明书实施例公开了一种多模态数据的融合方法、装置及设备,该方法包括:获取资源交易中风险防控业务的业务数据中包含的多种不同模态的模态数据,多种不同模态的模态数据中包含序列化模态的模态数据和非序列化模态的模态数据,将每种非序列化模态的模态数据分别输入到模态融合模型中的第一模态编码子模型中,得到对应的第一数据表征,获取序列化模态的模态数据对应的输入编码信息,并确定每个第一数据表征插入到输入编码信息中的位置对应的第二位置编码信息,基于每个第一数据表征和相应的第二位置编码信息,以及输入编码信息,生成输入序列编码信息,将输入序列编码信息输入到模态融合模型中的第二模态编码子模型中,得到对应的融合表征。

    一种模型的处理方法、装置及设备

    公开(公告)号:CN118070922A

    公开(公告)日:2024-05-24

    申请号:CN202410276169.3

    申请日:2024-03-11

    Abstract: 本说明书实施例公开了一种模型的处理方法、装置及设备,该方法包括:获取多个不同模态的模态数据,将多个不同模态的模态数据分别输入到表征模型中相应的模态编码器中,得到每种模态的模态数据对应的第一数据表征,基于不同模态的模态数据对应的第一数据表征,通过对比学习的方式和预设的第一损失函数,确定第一损失信息,通过表征模型将不同模态的模态数据对应的第一数据表征进行表征融合处理,并将融合后的数据表征输入表征模型中的表征增强子模型中,基于表征增强子模型的输出结果和多个不同模态的模态数据对应的标签信息,通过预设的第二损失函数,确定第二损失信息,基于第一损失信息和第二损失信息对表征模型进行预训练。

    一种异常检测方法、装置、设备及可读存储介质

    公开(公告)号:CN117313141A

    公开(公告)日:2023-12-29

    申请号:CN202311147658.0

    申请日:2023-09-06

    Abstract: 本说明书公开了一种异常检测方法、装置、设备及可读存储介质,确定在异常检测时刻包含待检测对象的目标拓扑图,根据目标拓扑图中与待检测对象通过边连接的邻居节点、待检测对象以及待检测对象与邻居节点之间的边,确定待检测对象的目标特征,基于待检测对象的目标特征,确定待检测对象在异常检测时刻的异常检测结果。基于在异常检测时刻的目标拓扑图确定待检测对象的目标特征,利用随时间变化的邻居节点的信息,以及随时间变化的待检测对象与邻居节点之间的边的信息,汇总动态变化的图结构和时序信息,从而得到待检测对象在异常检测时刻的异常检测结果,从而基于异常检测结果判断待检测对象是否存在异常,保证了线上业务和隐私数据的安全性。

    一种模型训练的方法、装置、存储介质及电子设备

    公开(公告)号:CN117113174A

    公开(公告)日:2023-11-24

    申请号:CN202311008790.3

    申请日:2023-08-10

    Abstract: 本说明书公开了一种模型训练的方法、装置、存储介质及电子设备,获取样本数据,将样本数据输入待训练的机器学习模型,得到样本特征。针对每个样本特征,确定该样本特征的信息量,确定该样本特征与目标任务的相关性,根据各样本特征的信息量以及各样本特征与目标任务的相关性,确定各样本特征的评估值,根据各样本特征的评估值,对各样本特征进行选择,得到最终样本特征。根据最终样本特征,对待训练的机器学习模型进行训练。实现了对机器学习模型的样本特征的选择,使得选取到的样本特征与目标任务相关性高的同时包含的信息量大,减少训练时间,降低机器学习模型对硬件设备计算资源以及存储资源的要求,提高机器学习模型的性能。

    一种风险识别的方法、装置、存储介质及电子设备

    公开(公告)号:CN119831325A

    公开(公告)日:2025-04-15

    申请号:CN202411824619.4

    申请日:2024-12-11

    Abstract: 本说明书公开了一种风险识别的方法、装置、存储介质和电子设备,所述方法包括:确定待识别用户的交易数据,并根据交易数据,确定待识别用户的交易关系图。将交易关系图输入风险识别模型的状态空间子网,对在历史时刻与待识别用户存在交易关系的第一用户对应的第一信息进行特征提取,确定历史特征。对在当前时刻与待识别用户存在交易关系的第二用户对应的第二信息进行特征提取,确定当前特征,将历史特征和当前特征输入风险识别模型中的特征聚合子网,确定聚合特征。将聚合特征输入风险识别模型的识别层,确定风险识别结果。通过状态空间子网确定历史特征,聚合历史特征和当前特征,确定风险识别结果,提高风险识别的自由度和准确性。

    一种语言模型的预训练方法、装置、介质及电子设备

    公开(公告)号:CN118690848A

    公开(公告)日:2024-09-24

    申请号:CN202410703975.4

    申请日:2024-05-31

    Abstract: 本说明书公开了一种语言模型的预训练方法、装置、介质及电子设备,可获取第一样本文本,第一样本文本为结构化文本,并提取第一样本文本中的各字段。针对提取出的每个字段,根据该字段的属性以及属性值,确定该字段对应的标识符,并根据确定出的各字段对应的标识符,得到第一样本文本对应的标识符序列。将标识符序列输入语言模型,得到标识符序列对应的文本特征,以根据文本特征以及预设的训练任务,对语言模型中的编码端进行预训练。通过使用标识符去对结构化文本中的字段进行替换,进而使用结构化文本对应的标识符序列去训练语言模型,使得训练得到的语言模型可以学习到结构化文本中的特征的关联关系以及潜在关系,提高了语言模型的准确度。

    一种基于交易数据的用户分类方法、装置、介质及设备

    公开(公告)号:CN118628248A

    公开(公告)日:2024-09-10

    申请号:CN202410853853.3

    申请日:2024-06-27

    Abstract: 本说明书公开了一种基于交易数据的用户分类方法、装置、介质及设备,服务器在接收包含各用户的交易数据的交易数据集后,针对每个用户,根据交易数据集确定出与该用户在至少同一个交易对象进行过交易的用户,作为相关用户,而后根据交易数据集中的交易数据,确定该用户与该用户对应相关用户之间的业务相似度,进而根据每个用户与各自对应相关用户之间的业务相似度,得到针对各用户的分类结果。通过限定与用户在同一个交易对象进行过交易的用户作为相关用户,并仅计算用户与对应的相关用户之间的业务相似度,大幅减少了计算资源的耗费,提高了基于业务相似度对各用户进行分类的效率。

    一种异常检测方法、装置、存储介质及电子设备

    公开(公告)号:CN116432048A

    公开(公告)日:2023-07-14

    申请号:CN202310350772.7

    申请日:2023-03-28

    Abstract: 本说明书公开了一种异常检测方法、装置、存储介质及电子设备。在本说明书提供的异常检测方法中,获取待检测数据;将所述待检测数据输入预先训练的检测模型,以通过所述检测模型中的提取子网提取所述待检测数据的原始特征;将所述原始特征输入所述检测模型的重构子网,以通过所述重构子网对所述原始特征进行处理操作,得到中间特征,并对所述中间特征进行还原操作,得到所述待检测数据的重构特征,其中,所述处理操作至少包括降维操作,所述还原操作至少包括升维操作;根据所述原始特征与所述重构特征,确定所述原始特征与所述重构特征之间的相似度;根据所述相似度,确定所述待检测数据是否异常。

    一种基于特征仿真的风险控制的方法、装置、介质及设备

    公开(公告)号:CN116405561A

    公开(公告)日:2023-07-07

    申请号:CN202310345422.1

    申请日:2023-03-29

    Abstract: 本说明书公开了一种基于特征仿真的风险控制的方法、装置、介质及设备,在本说明书提供的的方法中,针对每个用户,本方法先获取目标时刻的当前流式业务数据、存储的该用户的历史特征仿真结果,然后根据预设的算子对当前流式业务数据与该用户的历史特征仿真结果进行统计,确定该用户在该目标时刻的特征仿真结果并存储,当对目标用户进行风险控制时,根据存储的该目标用户的特征仿真结果确定目标用户的分类结果以进行风险控制。本方法只需确定目标时刻的当前流式业务数据与存储的用户的历史特征仿真结果,就可以确定用户在该目标时刻的各种特征仿真结果,进行风险控制,实现了基于流式数据的特征仿真,节省了特征仿真所需存储空间。

Patent Agency Ranking