-
公开(公告)号:CN114707644A
公开(公告)日:2022-07-05
申请号:CN202210440602.3
申请日:2022-04-25
Applicant: 支付宝(杭州)信息技术有限公司 , 北京邮电大学
Abstract: 本说明书实施例提供一种图神经网络的训练方法,涉及基于用户关系图谱对图神经网络进行多轮次迭代更新,其中任一轮次包括:利用当前图神经网络对所述用户关系图谱进行处理,得到与该用户关系图谱中多个用户节点对应的多个分类预测向量;基于所述多个分类预测向量,为所述多个用户节点中第一数量的未标注节点分配对应的伪分类标签;针对所述第一数量的未标注节点中的各个未标注节点,确定利用其训练所述当前图神经网络而产生的信息增益;根据与所述多个用户节点中各个标注节点对应的分类预测向量和真实分类标签,以及与所述各个未标注节点对应的分类预测向量、伪分类标签和信息增益,更新所述当前图神经网络中的模型参数。
-
公开(公告)号:CN114372566A
公开(公告)日:2022-04-19
申请号:CN202210277845.X
申请日:2022-03-21
Applicant: 支付宝(杭州)信息技术有限公司 , 北京邮电大学
Abstract: 本说明书实施例公开了图数据的增广、图神经网络训练方法、装置以及设备。增广方案包括:所述图数据包括多个节点以及节点之间的边;确定所述图数据中的指定节点以及所述指定节点的邻居节点;在所述邻居节点中选择部分节点,作为待增广节点;在所述图数据中的所述待增广节点对应的路径上,选择与所述待增广节点的距离小于预设阈值的节点,作为目标节点;将所述待增广节点与所述指定节点之间的边删除,并在所述目标节点与所述指定节点之间生成新的边,以生成增广图数据。
-
公开(公告)号:CN114707644B
公开(公告)日:2024-09-06
申请号:CN202210440602.3
申请日:2022-04-25
Applicant: 支付宝(杭州)信息技术有限公司 , 北京邮电大学
IPC: G06N3/042 , G06F18/214 , G06F18/2415 , G06F16/28 , G06N3/08
Abstract: 本说明书实施例提供一种图神经网络的训练方法,涉及基于用户关系图谱对图神经网络进行多轮次迭代更新,其中任一轮次包括:利用当前图神经网络对所述用户关系图谱进行处理,得到与该用户关系图谱中多个用户节点对应的多个分类预测向量;基于所述多个分类预测向量,为所述多个用户节点中第一数量的未标注节点分配对应的伪分类标签;针对所述第一数量的未标注节点中的各个未标注节点,确定利用其训练所述当前图神经网络而产生的信息增益;根据与所述多个用户节点中各个标注节点对应的分类预测向量和真实分类标签,以及与所述各个未标注节点对应的分类预测向量、伪分类标签和信息增益,更新所述当前图神经网络中的模型参数。
-
公开(公告)号:CN119202393A
公开(公告)日:2024-12-27
申请号:CN202411371727.0
申请日:2024-09-27
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/9535 , G06F18/23213 , G06F18/25 , G06F18/22 , G06F21/62 , G06N3/0455 , G06N3/08 , G06N5/04
Abstract: 本说明书实施例提供了一种基于大模型的推送模型训练方法、信息推送方法及装置。为了使得工业推送系统受益于大模型的知识,可以首先从全量用户中采样种子用户,基于种子用户从大模型中提取高质量、可重用的推送知识,并加入推理池。在对推送模型进行训练时,通过向量检索将推理池中的推送知识扩展到整个用户群,并将检索到的推送知识作为补充信息与第一用户样本的嵌入向量进行融合,得到第一用户样本的融合表征,利用该增强后的融合表征对推送模型进行更新。在推送模型经过这样的训练之后可以将其应用于工业场景中进行信息推送。方法执行过程中会使用到用户的历史行为数据,这些数据属于隐私数据,在数据处理过程中需要进行隐私保护。
-
公开(公告)号:CN118379114A
公开(公告)日:2024-07-23
申请号:CN202410621838.6
申请日:2024-05-17
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06Q30/0601 , G06N3/042 , G06N3/08 , G06N5/022
Abstract: 本说明书实施例提供一种图神经网络的训练及商品推送的技术方案,在进行商品推送过程中引入知识图谱,而为了训练用于处理知识图谱的图神经网络,引入用户意图、商品原型,以及用户意图和商品原型之间的决策路径。如此,基于经由用户意图优化的用户表征、经由商品原型优化的商品表征、决策路径数量、偏好预测的损失共同确定预测损失,如此训练的图神经网络可以携带用户意图和路径决策信息,从而更准确地进行信息推送。
-
公开(公告)号:CN118114785A
公开(公告)日:2024-05-31
申请号:CN202311867081.0
申请日:2023-12-29
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06N20/00 , G06N5/04 , G06N5/022 , G06F16/2452 , G06F16/242 , G06F18/22
Abstract: 本说明书实施例提供一种训练目标模型、生成结构化语句的方法及装置,在训练目标模型的方法中,先基于预设的推理库,利用参数量较大的大语言模型,构建训练样本集。该训练样本集可以包括,第一训练样本和第二训练样本,其中,第一训练样本包括第一提示文本和作为其输出标签的第一回答文本,第一提示文本包括自然语言的第一查询语句和类比推理示例,第一回答文本包括第一结构化语句。第二训练样本包括,第二提示文本和作为其输出标签的第二回答文本,第二提示文本包括第一查询语句和类比推理示例,第二回答文本包括第一推理语句。接着,利用该训练样本集来训练参数量较少的目标模型。
-
公开(公告)号:CN116401453A
公开(公告)日:2023-07-07
申请号:CN202310355474.7
申请日:2023-03-31
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/9535 , G06F16/9536 , G06F16/9537 , G06F16/332 , G06F16/33 , G06F16/35 , G06F18/2415 , G06F40/30 , G06N3/09
Abstract: 本说明书的实施例提供了一种用于训练长尾数据表征模型的方法和装置。在该用于训练长尾数据表征模型的方法中,循环执行下述模型训练过程:将当前训练样本集的头部子图数据和尾部子图数据分别提供给当前长尾数据表征模型的第一图神经网络和第二图神经网络,得到当前训练样本集的头部历史查询数据节点和尾部历史查询数据节点分别对应的特征表征;针对各个尾部历史查询数据节点,在当前训练样本集中确定该尾部历史查询数据节点的匹配头部历史查询数据节点;根据由尾部历史查询数据节点和对应的匹配头部历史查询数据节点组成的正样本对,确定知识迁移对比损失值;响应于不满足训练结束条件,基于知识迁移对比损失值调整当前长尾数据表征模型的参数。
-
公开(公告)号:CN111538906B
公开(公告)日:2023-06-20
申请号:CN202010477510.3
申请日:2020-05-29
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/9535 , G06F21/62 , G06F40/30 , G06N3/0464
Abstract: 本说明书实施例提供一种基于隐私保护的信息推送方法和装置,可以用于在保护用户隐私数据的前提下,基于历史会话中的对象选择序列建立异构图,并根据异构图体现出的推送对象之间的深层关联关系,从多个候选推送对象中确定若干个目标对象进行信息推送。根据一个实施方式,可以获取当前会话中的对象选择序列,并添加目标项构成预测序列,接着,将预测序列中的各项基于异构图确定描述向量,再根据各个描述向量推测目标项的预测向量,之后根据预测向量和各个候选推送对象的描述向量的对比,为目标项确定多个目标对象。该实施方式可以提高信息推送的准确度。
-
公开(公告)号:CN116186399A
公开(公告)日:2023-05-30
申请号:CN202310111774.0
申请日:2023-02-13
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/9535 , G06N3/08
Abstract: 本说明书实施例提供一种确定服务平台向用户推荐的目标对象的方法和装置,方法包括:获取第一用户的用户画像特征、第一用户在服务平台历史交互过的各对象构成的交互序列的序列特征、向第一用户推荐的备选对象的备选对象特征;备选对象为多个对象中的任一对象;将用户画像特征、序列特征、备选对象特征输入预先训练的神经网络模型,输出关于第一用户本次与备选对象交互的至少一个第一指标的第一预测指标值,以及与第一用户复登服务平台有关的至少一个第二指标的第二预测指标值;根据各个对象对应的第一预测指标值和第二预测指标值,从多个对象中确定出服务平台向第一用户推荐的目标对象。能够使得确定出的目标对象更符合用户偏好。
-
公开(公告)号:CN111400560A
公开(公告)日:2020-07-10
申请号:CN202010162355.6
申请日:2020-03-10
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/901 , G06F16/906 , G06F40/295 , G06Q40/02 , G06N3/04
Abstract: 本说明书一个或多个实施例公开了一种基于异构图神经网络模型进行预测的方法和系统,所述方法包括:获取与预测内容相关的异构图数据,所述异构图数据包括待预测节点、所述待预测节点的邻居节点、以及连接所述待预测节点与所述邻居节点之间的路径,所述路径包括至少一种类型;基于所述路径的类型,对所述邻居节点进行分组,以使得同一组的所述邻居节点的路径的类型相同;将所述待预测节点、分组后的所述邻居节点以及节点之间的路径输入训练好的异构图神经网络模型,得到待预测节点的表示向量后输入训练好的预测模型进行预测。
-
-
-
-
-
-
-
-
-