-
公开(公告)号:CN119538265A
公开(公告)日:2025-02-28
申请号:CN202411641076.2
申请日:2024-11-18
Applicant: 浙江大学 , 上海上湖信息技术有限公司
IPC: G06F21/57 , G06F21/64 , G16C20/50 , G16C20/70 , G16C20/30 , G06N3/0455 , G06N3/042 , G06N3/0499 , G06N3/084 , G06N3/092
Abstract: 本发明公开了一种面向分子预训练模型的数据窃取风险评估方法和系统,属于图结构数据处理领域。获取待评估的分子预训练模型及其对应的分子训练集;采用与分子训练集相同类型的辅助训练集训练一个可学习的分子评分函数;基于强化学习的分子生成模块产生潜在于分子训练集中的分子候选集;利用训练后的分子评分函数从分子候选集中筛选出最终分子集,根据最终分子集与分子训练集的相似度评估分子预训练模型的数据窃取风险,相似度越高,模型的数据窃取风险越大。本发明提出了一种分子预训练模型的训练数据提取方法并用于该模型的数据窃取风险评估,利用强化学习提高提取效率,同时提出的评分函数与模型无关,具有广泛的适用性和较高的准确性。
-
公开(公告)号:CN117764709A
公开(公告)日:2024-03-26
申请号:CN202311685088.0
申请日:2023-12-08
Applicant: 上海上湖信息技术有限公司
Abstract: 本发明公开了一种确定用户的信用状态的方法及装置,其中方法包括:获取第一数据集对应的第一结构图和第二数据集对应的第二结构图;其中,第一数据集包括M个用户的特征信息和M个用户的信用状态信息,第二数据集包括N个用户的特征信息;根据第一结构图和第二结构图,确定第三结构图;第三结构图和第二结构图的结构属性相同,结构属性为度分布或接近中心性分布;根据第三结构图对神经网络模型进行训练;将第二结构图输入训练后的神经网络模型,确定N个用户的信用状态信息。采用上述方法,利用与第二结构图结构属性相同的第三结构图训练神经网络模型,可以实现准确确定第二结构图中用户节点的信用状态信息。
-
公开(公告)号:CN112819154A
公开(公告)日:2021-05-18
申请号:CN202110072779.8
申请日:2021-01-20
Applicant: 上海上湖信息技术有限公司 , 浙江大学
IPC: G06N3/08
Abstract: 本发明公开了一种应用于图学习领域的预训练模型的生成方法及装置,包括:从第一图结构样本中确定第一节点并确定第一节点的第一样本子图,其中,第一图结构样本为第一训练样本中的任一个,第一图结构样本的各节点的属性与第一训练样本中第二图结构样本的各节点的属性不同,再确定第一节点的图基元标签向量和第一样本子图的初始表示向量,然后得到第一特征表示向量和得到第一节点的图基元预测向量,最后根据图基元预测向量和图基元标签向量,训练初始预训练模型,直至得到预训练模型。进而实现通过多个图结构样本得到预训练模型,且多个图结构样本的属性不同,以使预训练模型可以作为各属性的图结构的预训练模型。
-
公开(公告)号:CN112819154B
公开(公告)日:2024-05-28
申请号:CN202110072779.8
申请日:2021-01-20
Applicant: 上海上湖信息技术有限公司 , 浙江大学
Abstract: 本发明公开了一种应用于图学习领域的预训练模型的生成方法及装置,包括:从第一图结构样本中确定第一节点并确定第一节点的第一样本子图,其中,第一图结构样本为第一训练样本中的任一个,第一图结构样本的各节点的属性与第一训练样本中第二图结构样本的各节点的属性不同,再确定第一节点的图基元标签向量和第一样本子图的初始表示向量,然后得到第一特征表示向量和得到第一节点的图基元预测向量,最后根据图基元预测向量和图基元标签向量,训练初始预训练模型,直至得到预训练模型。进而实现通过多个图结构样本得到预训练模型,且多个图结构样本的属性不同,以使预训练模型可以作为各属性的图结构的预训练模型。
-
公开(公告)号:CN117764712A
公开(公告)日:2024-03-26
申请号:CN202311791166.5
申请日:2023-12-22
Applicant: 上海上湖信息技术有限公司
IPC: G06Q40/03 , G06F16/901 , G06N5/022
Abstract: 本申请提供一种用户标签确定方法及装置,该方法包括:获取图数据,其中,图数据中的每个节点表示一个用户,图数据中的每个边表明通过该边连接的两个节点所对应的两个用户具有关联关系;根据图数据,确定多个数据簇,其中,每个数据簇对应图数据中的多个节点,且与多个节点中的任意一个节点连接的任意一个节点也属于多个节点;针对每个数据簇中的每个节点的度数计算相应的指标值,并确定每个数据簇中最大指标值对应的节点;根据每个数据簇中最大指标值对应的节点的金融数据为相应的用户设置标签。采用上述方法仅需对每个数据簇中最大指标值节点所对应的用户设置相应的标签,可以减少需要设置标签的用户数量,显著提升效率。
-
公开(公告)号:CN117743916A
公开(公告)日:2024-03-22
申请号:CN202311667105.8
申请日:2023-12-06
Applicant: 上海上湖信息技术有限公司
IPC: G06F18/241 , G06F18/214 , G06F18/2433
Abstract: 本申请实施例提供了一种模型训练方法、异常信息检测方法及装置,涉及计算机技术领域,包括:获取样本数据集;采用所述样本数据集迭代执行异常检测任务和图预训练任务,并在每次迭代过程中,获得所述异常检测任务和所述图预训练任务之间的一致性指标,并基于所述一致性指标调整用于执行所述异常检测任务的异常检测模型的模型参数;在所述一致性指标满足预设条件时停止迭代,获得初步训练的异常检测模型;对所述初步训练的异常检测模型和初始化的分类器进行微调训练,获得目标异常检测模型和目标分类器,能够有效识别图网络结构中异常节点的结构,准确分辨正常用户和异常用户,有效提高了异常检测结果的准确性。
-
-
-
-
-