-
公开(公告)号:CN111291165A
公开(公告)日:2020-06-16
申请号:CN202010384236.5
申请日:2020-05-09
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/33 , G06F16/35 , G06F40/289 , G06F40/30
Abstract: 本说明书实施例提供一种训练词向量嵌入模型的方法,该方法包括多次迭代更新,其中任一次包括:先从训练语句对应的词语序列中,确定中心词语和对应的多个上下文词语;接着,根据第一词向量矩阵,确定该中心词语对应的中心词向量,以及根据第二词向量矩阵,确定该多个上下文词语对应的多个上下文词向量;然后,基于该多个上下文词向量彼此之间的相似度,确定其对应的多个注意力权重;再利用该多个注意力权重,对该多个上下文词向量进行加权求和,得到中心词语的上下文表示向量;再然后,计算该中心词向量与该上下文表示向量之间的第一相似度;最后,至少以增大该第一相似度为目标,更新上述第一词向量矩阵和第二词向量矩阵。
-
公开(公告)号:CN112085615B
公开(公告)日:2024-10-11
申请号:CN202011009910.8
申请日:2020-09-23
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例提供一种图神经网络的训练方法,包括:获取关系网络图,其中各个对象节点对应采样概率集,包括针对其每个一阶邻居节点的采样概率;基于该关系网络图,对该图神经网络进行多轮迭代更新,其中任一轮包括:以本轮选取的第一标签节点为中心,进行M阶邻居节点采样,其中任意的第i阶邻居节点采样包括,针对已采样的第i‑1阶邻居节点中任意的第一节点,基于其当前采样概率集,从其一阶邻居节点全集中采样若干邻居节点归入第i阶邻居节点;基于采样到的M阶以内的邻居节点和该第一标签节点带有的第一业务标签,对该图神经网络进行本轮更新;利用更新后图神经网络确定若干邻居节点对应的若干训练反馈,进而更新第一节点的当前采样概率集。
-
公开(公告)号:CN113487163B
公开(公告)日:2024-09-24
申请号:CN202110741178.1
申请日:2021-06-30
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06Q10/0637 , G06F16/29
Abstract: 本说明书实施例提供一种基于地理位置信息进行业务预测的方法及装置,在进行业务预测的方法中,获取用户的当前位置。确定该当前位置在层次编码方式下的目标位置编码。之后,针对该目标位置编码,利用滑动窗口提取对应的编码片段序列。将编码片段序列输入基于时序的神经网络模型,得到对应的特征向量。最后,至少将该特征向量输入业务预测模型,得到业务预测结果。
-
公开(公告)号:CN118153773A
公开(公告)日:2024-06-07
申请号:CN202410417578.0
申请日:2024-04-08
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例提供一种时间序列预测方法及装置,在进行时序预测过程中,考虑细时间粒度中的时序数据长度较大的情形,为了充分利用细时间粒度下的时序数据,通过按时间周期分割将长序列转换成短序列,并对短序列进行切片、提取单个短序列的切片编码、提取各个短时序中的对应时间区间的切片表征,进而通过拼接、形状重塑、融合等处理,进行分时间周期的长时序预测。这种实施方式可以减少参数量,提高对长时序数据处理的有效性。
-
公开(公告)号:CN111461299B
公开(公告)日:2022-08-12
申请号:CN202010230847.4
申请日:2020-03-27
Applicant: 支付宝(杭州)信息技术有限公司
Inventor: 吴郑伟
IPC: G06N3/04 , G06N3/08 , G06K9/62 , G06F16/9535
Abstract: 本说明书一个或多个实施例提供了一种用户分类模型的训练方法及信息推送方法。在一种实施例中,一种用户分类模型的训练方法包括:获取多个第一训练样本,每个第一训练样本包括第一用户图结构数据、第一资源图结构数据和第一标记值;对每个第一训练样本执行以下步骤:将第一用户图结构数据输入第一图神经网络模型,得到第一用户对应的第一用户嵌入表达向量;将第一资源图结构数据输入第二图神经网络模型,得到第一资源对应的第一资源嵌入表达向量;将第一用户嵌入表达向量和第一资源嵌入表达向量输入第一分类器,得到第一分类结果;基于各个第一训练样本对应的第一分类结果及第一标记值,调整第一分类模型的参数,得到训练后的第一分类模型。
-
公开(公告)号:CN112581191B
公开(公告)日:2022-07-19
申请号:CN202011626281.3
申请日:2020-08-14
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06Q30/02 , G06K9/62 , G06N3/04 , G06N3/08 , G06V10/764 , G06V10/762 , G06V10/80 , G06V10/82
Abstract: 本说明书实施例提供一种行为预测模型的训练方法,包括:针对目标对象,获取基于多个种子用户形成的多个正样本,其中任意的第一正样本包括,与第一种子用户对应的第一用户特征和正例标签,此标签指示对应用户是被确定为对目标对象做出特定行为的用户;基于多个种子用户各自的用户特征,采用无监督的离群点检测算法,确定第一种子用户的离群分数,作为针对行为预测任务的第一训练权重;利用包括上述多个正样本以及预先获取的多个负样本,对第一行为预测模型进行第一训练,具体包括:将第一用户特征输入第一行为预测模型中,结合得到的行为预测结果和上述正例标签,确定行为预测损失,并利用第一训练权重对其进行加权处理,以训练第一行为预测模型。
-
公开(公告)号:CN111461904B
公开(公告)日:2022-06-21
申请号:CN202010304997.5
申请日:2020-04-17
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书一个或多个实施例公开了对象类别的分析方法及装置,用于解决现有技术中对象类别的分析准确度较低的问题。所述方法包括:获取属于目标类别的第一对象对应的第一文本,及,获取第二对象对应的第二文本。利用预先训练的序列到序列模型及词向量集,确定所述第一文本对应的第一文本向量及所述第二文本对应的第二文本向量,所述序列到序列模型为根据具有相关性标签信息的多个样本文本训练得到,各所述样本文本包含多个有序的样本词语。基于所述第一文本向量及所述第二文本向量,确定所述第一文本及所述第二文本之间的相关性信息。根据所述第一文本及所述第二文本之间的相关性信息,确定所述第二对象是否属于所述目标类别。
-
公开(公告)号:CN111681059B
公开(公告)日:2020-11-13
申请号:CN202010819192.4
申请日:2020-08-14
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例提供一种行为预测模型的训练方法,包括:先确定针对目标对象的多个样本用户,其中任一的第一样本用户对应第一样本硬标签,指示是否对该目标对象做出特定行为;再基于利用训练后的图神经网络对用户‑对象二部图进行图嵌入处理而确定的嵌入向量集,确定对应于第一样本用户的样本用户特征向量以及对应于目标对象的目标对象特征向量,进而确定第一样本用户对目标对象做出特定行为的特定行为概率,作为第一样本软标签,并且,将该样本用户特征向量输入第一行为预测模型中,得到行为预测结果;利用基于该预测结果和第一样本硬标签确定的第一损失项,以及基于该预测结果和第一样本软标签确定的第二损失项,训练该第一行为预测模型。
-
公开(公告)号:CN119089042A
公开(公告)日:2024-12-06
申请号:CN202411140267.0
申请日:2024-08-19
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/9535 , G06F16/906 , G06F18/24 , G06N3/096 , G06N3/094 , G06N3/0455
Abstract: 本说明书实施例提出一种模型训练方法、推荐数据点击率的预测方法和电子设备,上述模型训练方法中,获取目标域样本数据和所述目标样本数据对应的点击率的标签值之后,首先分别通过学生模型中的第一表征解耦模型和第二表征解耦模型,以及已完成参数调整的老师模型中的域分类器,获得域共享表征向量和域独有表征向量,然后根据域共享表征向量和域独有表征向量,通过学生模型中的点击率预测模型获得目标域样本数据对应的点击率的第一预测值,最后,以最小化学生模型的损失函数为目的,调整点击率预测模型、第一表征解耦模型和第二表征解耦模型的参数,其中,学生模型的损失函数包括目标域样本数据对应的点击率的标签值和第一预测值之间的交叉熵。
-
公开(公告)号:CN118211729A
公开(公告)日:2024-06-18
申请号:CN202410417783.7
申请日:2024-04-08
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例提供一种时间序列预测方法及装置,在进行时序预测过程中,考虑到所利用的历史时序数据可能存在缺失从而导致偏差,可以对粗粒度历史时间序列和细粒度历史时间序列分别进行处理,并基于对预测的细粒度时间序列的统计确定具有可比性的粗粒度时序数值。其中,利用粗粒度历史时间序列可以预测粗粒度时序。而粗粒度时序中,单个时间区间(如对应单个时间节点)可以对应多个细粒度时间段,因此,还可以利用细粒度历史时间序列预测粗粒度时序下的细粒度时序分布,并通过分配比例进行描述。从而,可以按照所确定的分配比例,以及粗粒度预测结果,进行细粒度时间序列的预测。如此,可以提高时序预测结果的准确性。
-
-
-
-
-
-
-
-
-