-
公开(公告)号:CN116644802A
公开(公告)日:2023-08-25
申请号:CN202310889891.X
申请日:2023-07-19
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例提供一种模型训练方法及装置,涉及计算机技术领域。该方法包括:采集样本数据;将所述样本数据输入第一初始模型,得到所述样本数据对应的损失函数,所述第一初始模型为部署于所述端节点上的待训练模型;根据所述损失函数,计算所述样本数据对应的梯度;将所述梯度上传至边缘节点,以使所述边缘节点根据所述梯度更新第二初始模型中的参数,得到最终模型,所述第二初始模型为部署于所述边缘节点上的所述待训练模型。本说明书提供的方案能够在模型的训练过程能够充分利用各个节点上的计算算力和网络带宽,同时保证模型的地域性和时效性。
-
公开(公告)号:CN116628348A
公开(公告)日:2023-08-22
申请号:CN202310893802.9
申请日:2023-07-19
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/9535 , G06F9/50
Abstract: 本申请涉及人工智能技术领域,具体提供了一种业务推荐的系统、方法、装置、电子设备及存储介质。一种业务推荐的方法,包括将业务操作数据发送给数据服务器;接收数据服务器基于业务操作数据返回的目标嵌入层特征;采用预先训练好的业务推荐目标模型,基于业务操作数据以及目标嵌入层特征,生成业务推荐数据;基于业务推荐数据,执行业务推荐操作。本申请实施例中,在终端设备资源有限的情况下,通过数据服务器进行复杂的数据处理操作,减少了终端设备数据处理耗费的资源,提高了业务推荐效率,以及可以采用复杂度高的业务推荐目标模型进行业务推荐,提高了业务推荐的准确度。
-
公开(公告)号:CN116610869A
公开(公告)日:2023-08-18
申请号:CN202310862674.1
申请日:2023-07-13
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/9535 , G06F16/9538 , G06N20/00
Abstract: 本说明书一个或多个实施例提供一种推荐内容管理方法及装置、电子设备及存储介质,所述方法包括:向服务端发送内容推荐请求,其中,所述内容推荐请求用于请求所述服务端生成并返回针对显示界面的多个显示区的推荐内容;接收所述服务端返回的多个推荐内容,以及所述多个推荐内容中每个推荐内容的数据标签,其中,所述多个推荐内容中每个推荐内容的数据标签由所述服务端每个推荐内容进行NER实体抽取得到,所述多个推荐内容与所述多个显示区一一对应;根据所述多个推荐内容中每个推荐内容的数据标签,对所述多个推荐内容进行去重处理,并将去重处理后剩余的至少一个推荐内容曝光于对应的显示区。
-
公开(公告)号:CN116596065A
公开(公告)日:2023-08-15
申请号:CN202310848180.8
申请日:2023-07-12
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本申请公开了一种梯度计算方法、装置、存储介质、产品及电子设备,其中,方法包括:边缘侧接收客户端发送的预设个数的梯度数据,所述梯度数据为所述客户端在对模型进行训练过程中所获取的,对所述预设个数的梯度数据进行平均计算处理,获得平均梯度数据,将所述平均梯度数据发送至云端,云端接收边缘侧发送的平均梯度数据,将所述平均梯度数据发送至所述客户端,指示所述客户端对所述模型进行参数调整。
-
公开(公告)号:CN116384473A
公开(公告)日:2023-07-04
申请号:CN202310652126.6
申请日:2023-06-02
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06N3/082 , G06F16/9535
Abstract: 本说明书实施例提供了一种计算图改进、信息推送方法及装置。信息推送模型用于针对用户确定多条待选推送信息的评分。在该方法中,获取用户特征和待选推送信息特征,并据此特征对计算图的特征输入节点和其他节点进行类别标记,标记为与用户特征相关联的第一类,或者与待选推送信息特征相关联的第二类。接着,在属于第一类的特征输入节点与其下游节点之间增加切分节点,切分节点可以对输入的高维数据进行切分,并输出得到的低维数据。还要从其他节点中确定自身类别为第一类、其下游节点的类别为第二类的节点,作为用户特征叶节点。接着,在用户特征叶节点与其下游节点之间增加复制节点,复制节点对输入的低维数据进行复制,输出得到的高维数据。
-
公开(公告)号:CN116383458A
公开(公告)日:2023-07-04
申请号:CN202310650591.6
申请日:2023-06-02
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/9035 , G06Q30/0601
Abstract: 本说明书实施例提供一种信息推送的方法及装置,在信息推送的排序过程中将用于粗排的第一子网络和用于精排的第二子网络同时连接在嵌入模块之后,并增加动态选择模块完成第一子网络至第二子网络的连接,从而,在信息推送过程中在一个模型架构下完成信息排序,可以减少模型调用次数,且嵌入模块的嵌入结果可以由第一子网络和第二子网络共用。在信息推送过程中,先由第一子网络对候选信息进行粗排过滤,从而经由动态选择模块选择不固定条数的候选信息作为优选信息进行精排打分,之后,将优选信息的精排打分和其他候选信息的粗排打分结果一起进行融合排序,以按照打分结果进行信息推送。如此,可以提高信息推送的处理效率。
-
公开(公告)号:CN116011593B
公开(公告)日:2023-06-16
申请号:CN202310253084.9
申请日:2023-03-09
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例提供一种网络模型能耗的确定方法及装置,该方法包括:获取目标网络模型在训练过程的训练浮点计算总量;获取目标网络模型的当前调用量,当前调用量表示调用目标网络模型执行业务预测任务的次数;基于当前调用量及目标网络模型在单次业务预测任务执行过程的第一浮点计算量,确定预测浮点计算总量;基于训练浮点计算总量和预测浮点计算总量,确定目标网络模型的当前能耗量。
-
公开(公告)号:CN116011593A
公开(公告)日:2023-04-25
申请号:CN202310253084.9
申请日:2023-03-09
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例提供一种网络模型能耗的确定方法及装置,该方法包括:获取目标网络模型在训练过程的训练浮点计算总量;获取目标网络模型的当前调用量,当前调用量表示调用目标网络模型执行业务预测任务的次数;基于当前调用量及目标网络模型在单次业务预测任务执行过程的第一浮点计算量,确定预测浮点计算总量;基于训练浮点计算总量和预测浮点计算总量,确定目标网络模型的当前能耗量。
-
公开(公告)号:CN115392957A
公开(公告)日:2022-11-25
申请号:CN202210968175.6
申请日:2022-08-12
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例公开了一种模型训练中的注意力图的生成方法、装置以及设备。通过获取所述事件序列所对应的特征矩阵;确定所述事件序列中所包含的第i个事件所对应的第一时间向量x,确定所述事件序列中所包含的第j个事件所对应的第二时间向量x’;根据预设的时态内核、所述第一时间向量x和所述第二时间向量x’确定时间注意力权重矩阵kt;采用预设的事件内核确定所述事件键矩阵Ke和事件查询矩阵Qe所对应的事件注意力权重矩阵ke;融合所述时间注意力权重矩阵kt和所述事件注意力权重矩阵ke生成总注意力权重矩阵;根据所述总注意力权重矩阵和所述事件值矩阵Ve生成注意力图,从而体现出各事件的绝对时间和相对时间在相关性上的贡献。
-
公开(公告)号:CN114792173B
公开(公告)日:2022-10-04
申请号:CN202210694769.2
申请日:2022-06-20
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F17/00 , G06Q10/04 , G06K9/62 , G06F3/0484
Abstract: 本说明书实施例提供一种训练预测模型的方法和装置,该预测模型包括第一分支和第二分支;根据该方法,首先获取目标样本,其包括样本特征,第一标签和第二标签;第一标签指示用户是否点击了目标对象;第二标签表示该用户是否实施与目标对象有关的目标行为。利用预测模型对样本特征进行处理,第一分支输出用户点击目标对象的第一概率;第二分支输出用户实施目标行为的第二概率。基于第一标签值和第一概率,确定第一损失。并且,在预设条件满足的情况下,根据第二标签值和第二概率确定第二损失,并根据第一损失和第二损失确定该目标样本的预测损失,其中预设条件包括,第一标签值指示用户点击了目标对象。于是可以根据上述预测损失,训练该预测模型。
-
-
-
-
-
-
-
-
-