一种图神经网络的预训练方法及装置

    公开(公告)号:CN114819139A

    公开(公告)日:2022-07-29

    申请号:CN202210315789.4

    申请日:2022-03-28

    Abstract: 本说明书实施例提供一种图神经网络的预训练方法及装置,获取业务关系图的图集合,各业务关系图中的节点表示业务对象,连接边表示业务关联关系;图集合包括第一图和目标图,第一图和目标图基于同一样本业务关系图分别进行预设增强处理而得到;针对第一图,分别将图集合中各其他图作为第二图,利用图神经网络进行图间匹配表征,图间匹配表征包括,基于第一图自身,结合来自第二图的节点信息,确定该第一图的第一图表征,用于表示第一图相对于第二图的业务结构关联;基于第二图自身,结合来自第一图的节点信息,确定该第二图的第二图表征;至少基于将目标图作为第二图时得到的第一图表征和第二图表征,确定第一损失;根据第一损失,训练图神经网络。

    一种样本生成方法、装置以及设备

    公开(公告)号:CN114781488A

    公开(公告)日:2022-07-22

    申请号:CN202210295588.2

    申请日:2022-03-24

    Abstract: 本说明书实施例公开了一种样本生成方法、装置以及设备。方案包括:根据物品特征,以及用户对物品特征的注意力特征,通过模型预测第一样本用户对第一物品的第一偏好分和对第二物品的第二偏好分,第一偏好分高于第二偏好分;根据设定的注意力扰动参数,对第一样本用户的注意力特征进行调整,并根据调整后的注意力特征,对第一偏好分和第二偏好数据进行更新;以减小更新后的第一偏好分与第二偏好分之间的差距为目标,学习注意力扰动参数的目标取值;在目标取值下,若更新后的第一偏好分低于第二偏好分,则根据调整后的注意力特征,生成第二样本用户,用于训练模型。

    图节点关系表征生成和图节点业务关系预测方法及装置

    公开(公告)号:CN119248970A

    公开(公告)日:2025-01-03

    申请号:CN202411255331.X

    申请日:2021-08-30

    Inventor: 杨硕 张志强 周俊

    Abstract: 本说明书实施例提供图节点关系表征生成和图节点业务关系预测方法及装置。在生成图节点关系表征时,分别自第一和第二图节点开始执行节点表征传播和节点表征聚合,确定第二和第一图节点的节点表征;并且基于第一和第二图节点的节点表征,生成第一和第二图节点之间的节点关系表征。在节点表征传播时,将每个源图节点的上一节点传播表征传播给该源图节点的目标图节点集合的每个目标图节点;根据各个目标图节点接收的节点传播表征以及自身上一节点传播表征,生成各个目标图节点的当前节点传播表征。在节点表征聚合处理时,根据聚合图节点的上一节点表征以及邻居图节点的上一节点表征,生成聚合图节点的当前节点表征。

    基于大模型的推送模型训练方法、信息推送方法及装置

    公开(公告)号:CN119202393A

    公开(公告)日:2024-12-27

    申请号:CN202411371727.0

    申请日:2024-09-27

    Abstract: 本说明书实施例提供了一种基于大模型的推送模型训练方法、信息推送方法及装置。为了使得工业推送系统受益于大模型的知识,可以首先从全量用户中采样种子用户,基于种子用户从大模型中提取高质量、可重用的推送知识,并加入推理池。在对推送模型进行训练时,通过向量检索将推理池中的推送知识扩展到整个用户群,并将检索到的推送知识作为补充信息与第一用户样本的嵌入向量进行融合,得到第一用户样本的融合表征,利用该增强后的融合表征对推送模型进行更新。在推送模型经过这样的训练之后可以将其应用于工业场景中进行信息推送。方法执行过程中会使用到用户的历史行为数据,这些数据属于隐私数据,在数据处理过程中需要进行隐私保护。

    基于文本语料生成医疗知识图谱的方法及装置

    公开(公告)号:CN118152590A

    公开(公告)日:2024-06-07

    申请号:CN202410564986.9

    申请日:2024-05-08

    Abstract: 本说明书实施例提供一种基于文本语料生成医疗知识图谱的方法及装置,在基于文本语料构建知识图谱时,可以将知识图谱的数据获取过程分为开放式抽取和对齐两个阶段。具体而言,先由大模型从原始文本语料中开放式抽取实体词及相应的实体类型,还根据所抽取的实体词和实体类型提取相应连接关系。之后,再按照预先定义的实体模式和连接模式进行实体和关系的对齐,并根据对齐结果构建知识图谱。如此,可以提高知识图谱构建的全面性和有效性。

    基于医疗知识库的查询处理方法和装置

    公开(公告)号:CN118132680A

    公开(公告)日:2024-06-04

    申请号:CN202410545207.0

    申请日:2024-04-30

    Abstract: 本说明书实施例提供一种基于医疗知识库的查询处理方法和装置,其中,医疗知识库包括知识图谱,知识图谱中的节点包括标准词节点和词条节点,各词条节点具有对应子图作为其词条索引。方法包括:从查询请求中提取若干医学术语;基于若干医学术语,查询知识图谱,获得关联词查询结果和词条查询结果,关联词查询结果至少包括查询到的标准词节点,词条查询结果包括若干备选词条节点;根据关联词查询结果,确定查询请求与若干备选词条节点各自对应的子图的相关性得分;根据相关性得分,确定出目标词条,将对应的词条内容归入查询处理结果。能够提升查询到的词条的准确率。

    数据预测方法、装置、存储介质及设备

    公开(公告)号:CN117235469A

    公开(公告)日:2023-12-15

    申请号:CN202311125356.3

    申请日:2023-09-01

    Abstract: 本说明书公开了一种数据预测方法、装置、存储介质及设备,其中方法包括:首先获取目标事务在第一预设时长内的时序数据,然后将时序数据输入至预训练的位置编码模型中,得到位置编码数据,其中,位置编码数据包括时序数据对应的第一位置编码以及第二位置编码,第二位置编码用于指示目标事务的预测数据的位置指示信息,预测数据为预测第一预设时长后的第二预设时长内目标事务的事务数据,第二预设时长为与第一预设时长相邻的下一预设时长,最后将时序数据和位置编码数据输入至预训练的时序预测模型中进行预测,得到目标事务对应的预测数据。

    图表征增强模型训练方法、图表征方法及装置

    公开(公告)号:CN117151190A

    公开(公告)日:2023-12-01

    申请号:CN202311196462.0

    申请日:2023-09-15

    Abstract: 本说明书实施例提供图表征增强模型训练方法、图表征方法及装置。在进行模型训练时,通过对原始长尾图中的真头部节点进行邻域剪枝来构建稀疏图。使用图表征增强模型来对稀疏图中的各个节点进行图表征增强以得到各个节点的增强节点表征,各个节点的增强节点表征基于增强稀疏图学习出,增强稀疏图通过为稀疏图中的各个节点增强邻域缺失信息得到,各个节点的邻域缺失信息通过图表征增强模型来基于该节点的中心节点表征和邻居节点表征预测出。然后,根据伪尾部节点的增强节点表征以及原始长尾图中的对应真头部节点的节点表征,确定邻域信息预测损失函数;并基于邻域信息预测损失函数,调整图表征增强模型的模型参数。

    对象分类模型训练方法、对象分类预测方法及装置

    公开(公告)号:CN117034088A

    公开(公告)日:2023-11-10

    申请号:CN202311074369.2

    申请日:2023-08-23

    Abstract: 本说明书的实施例提供对象分类模型训练方法、对象分类预测方法及装置。在进行模型训练时,将对象图数据样本的对象节点特征数据和图拓扑结构信息提供给教师图神经网络模型来确定出对象图数据样本的用于指导对象分类模型训练的第一分类标签,对象分类模型包括感知机模型。随后,使用对象图数据的对象节点特征数据,在调整后的第一分类标签的指导下训练对象分类模型,对象图数据样本的第一分类标签根据该对象图数据样本的真实标签和该对象图数据样本经过对象分类模型后的第二分类标签进行调整。

Patent Agency Ranking