-
公开(公告)号:CN115577260A
公开(公告)日:2023-01-06
申请号:CN202211173543.4
申请日:2022-09-26
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F18/214 , G06F18/243
Abstract: 本说明书实施例提供了一种模型训练方法、节点信息确定方法及装置。在模型训练方法中,可以利用关系网络训练标签一致性模型。其中,关系网络包括多个节点以及节点之间的连接边。为了训练该标签一致性模型,首先可以从关系网络中获取训练样本,训练样本包含具有第一标签和第一特征的第一节点,以及具有第二标签和第二特征的第二节点,两个节点通过第一边相连接。然后,基于两个标签的比较确定第一边的可信度标签,其用于标识两个标签之间的一致性信息。接着,基于两个特征,通过标签一致性模型确定第一边的样本可信度,并基于样本可信度和可信度标签之间的差异确定预测损失,基于预测损失更新标签一致性模型。
-
公开(公告)号:CN111259931B
公开(公告)日:2022-06-28
申请号:CN202010021127.7
申请日:2020-01-09
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06K9/62
Abstract: 本说明书实施例公开了一种用户分组及活跃度确定方法。所述用户活跃度确定方法包括:分别获取多个用户的特征数据;基于用户的第一属性,将所述多个用户划分为至少一个群组;对于每个群组,利用聚类算法至少基于用户的特征数据,确定对应于每个用户的聚类簇;对于每一个聚类簇,获取该聚类簇中的用户在预设时间段内产生的交互数据以确定用户的活跃度。本说明书将多个用户划分为聚类簇,可以较为精确的确定存在交互行为的多个用户的各自的活跃度。
-
公开(公告)号:CN113487163A
公开(公告)日:2021-10-08
申请号:CN202110741178.1
申请日:2021-06-30
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例提供一种基于地理位置信息进行业务预测的方法及装置,在进行业务预测的方法中,获取用户的当前位置。确定该当前位置在层次编码方式下的目标位置编码。之后,针对该目标位置编码,利用滑动窗口提取对应的编码片段序列。将编码片段序列输入基于时序的神经网络模型,得到对应的特征向量。最后,至少将该特征向量输入业务预测模型,得到业务预测结果。
-
公开(公告)号:CN112085172A
公开(公告)日:2020-12-15
申请号:CN202010975525.2
申请日:2020-09-16
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例提供一种图神经网络的训练方法,包括:获取关系网络图,其中各个对象节点对应采样概率集,包括针对其每个一阶邻居节点的采样概率;基于该关系网络图,对该图神经网络进行多轮迭代更新,其中任一轮包括:以本轮选取的第一标签节点为中心,进行M阶邻居节点采样,其中任意的第i阶邻居节点采样包括,针对已采样的第i‑1阶邻居节点中任意的第一节点,基于其当前采样概率集,从其一阶邻居节点全集中采样若干邻居节点归入第i阶邻居节点;基于采样到的M阶以内的邻居节点和该第一标签节点带有的第一业务标签,对该图神经网络进行本轮更新;利用更新后图神经网络确定若干邻居节点对应的若干训练反馈,进而更新第一节点的当前采样概率集。
-
公开(公告)号:CN111291165B
公开(公告)日:2020-08-14
申请号:CN202010384236.5
申请日:2020-05-09
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/33 , G06F16/35 , G06F40/289 , G06F40/30
Abstract: 本说明书实施例提供一种训练词向量嵌入模型的方法,该方法包括多次迭代更新,其中任一次包括:先从训练语句对应的词语序列中,确定中心词语和对应的多个上下文词语;接着,根据第一词向量矩阵,确定该中心词语对应的中心词向量,以及根据第二词向量矩阵,确定该多个上下文词语对应的多个上下文词向量;然后,基于该多个上下文词向量彼此之间的相似度,确定其对应的多个注意力权重;再利用该多个注意力权重,对该多个上下文词向量进行加权求和,得到中心词语的上下文表示向量;再然后,计算该中心词向量与该上下文表示向量之间的第一相似度;最后,至少以增大该第一相似度为目标,更新上述第一词向量矩阵和第二词向量矩阵。
-
公开(公告)号:CN111259931A
公开(公告)日:2020-06-09
申请号:CN202010021127.7
申请日:2020-01-09
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06K9/62
Abstract: 本说明书实施例公开了一种用户分组及活跃度确定方法。所述用户活跃度确定方法包括:分别获取多个用户的特征数据;基于用户的第一属性,将所述多个用户划分为至少一个群组;对于每个群组,利用聚类算法至少基于用户的特征数据,确定对应于每个用户的聚类簇;对于每一个聚类簇,获取该聚类簇中的用户在预设时间段内产生的交互数据以确定用户的活跃度。本说明书将多个用户划分为聚类簇,可以较为精确的确定存在交互行为的多个用户的各自的活跃度。
-
公开(公告)号:CN110852755A
公开(公告)日:2020-02-28
申请号:CN201911075119.4
申请日:2019-11-06
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06Q20/40
Abstract: 本说明书实施例提供一种针对交易场景的用户身份识别方法和装置,方法包括:获取目标用户到目标商户进行交易时采集的目标用户的目标生物信息;查找与目标生物信息最相似的多个存储生物信息,将多个存储生物信息分别对应的用户作为目标用户的候选用户;根据针对关系网络图预先训练的图神经网络模型,确定各候选用户分别对应的各第一节点嵌入向量,以及目标商户对应的第二节点嵌入向量;根据各第一节点嵌入向量和第二节点嵌入向量,确定各候选用户到目标商户的各交易概率中的最大交易概率;当最大交易概率大于预设阈值时,将最大交易概率对应的候选用户确定为目标用户。能够提高交易场景中用户身份识别的准确性。
-
公开(公告)号:CN118350448A
公开(公告)日:2024-07-16
申请号:CN202410568375.1
申请日:2024-05-08
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06N3/096 , G06N3/094 , G06N3/0455 , G06F18/2321 , G06F18/2415 , G06F16/9535
Abstract: 本说明书实施例提供了目标模型的训练方法及装置,目标模型包括编码器和聚类网络,聚类网络中包括多个类簇的参数化的聚类原型。该方法包括:利用编码器,确定多个用户各自的编码结果,编码结果包括基于用户的原始行为序列得到的原始编码;利用聚类网络,基于各聚类原型和各原始编码确定各用户各自的聚类结果;基于各用户的编码结果与所归属的类簇的聚类原型之间的元素分布差异,确定自蒸馏损失;其中,该类簇基于聚类结果确定;基于训练损失,更新编码器的参数,训练损失包括自蒸馏损失。
-
公开(公告)号:CN118155015A
公开(公告)日:2024-06-07
申请号:CN202410301845.8
申请日:2024-03-15
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06V10/774 , G06V10/764 , G06N3/0464 , G06N3/0475 , G06N3/08 , G06F17/18 , G06Q10/04
Abstract: 本说明书的实施例提供了一种用于提升泛化性的模型训练方法和装置。在该用于提升泛化性的模型训练方法中,利用当前预测模型根据作为当前训练样本集的各个训练样本中的特征数据得到对应的预测结果;基于各个训练样本中的标签数据和对应的预测结果之间的差异确定训练样本预测损失值;再利用当前训练样本集中的各个训练样本所属的领域对应的当前领域重加权权重对各个训练样本预测损失值进行综合,得到当前训练样本集对应的预测损失值,进而确定当前总损失值;在不满足训练结束条件的情况下根据当前总损失值对当前预测模型的参数和当前领域重加权权重进行调整。
-
公开(公告)号:CN117408745A
公开(公告)日:2024-01-16
申请号:CN202311370240.6
申请日:2023-10-20
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06Q30/0211 , G06N5/04 , G06F18/214 , G06F18/25
Abstract: 本说明书的实施例提供了一种基于因果效应估计的增益预测方法和装置。在该基于因果效应估计的增益预测方法中,对所获取的待预测样本的初始特征表示和对应的关联样本的初始特征表示分别进行解耦,得到对应的调整变量特征表示和混淆变量特征表示;再根据所得到的关联样本对应的调整变量特征表示和混淆变量特征表示进行聚合,得到对应的、融合有关联样本的对应信息的聚合调整变量特征表示和聚合混淆变量特征表示;进而基于待预测样本的混淆变量特征表示以及对应的聚合调整变量特征表示和聚合混淆变量特征表示的融合确定对应的聚合预测特征表示;并据此确定待预测样本对应的增益大小。
-
-
-
-
-
-
-
-
-