-
-
公开(公告)号:CN117932164A
公开(公告)日:2024-04-26
申请号:CN202410139688.5
申请日:2024-01-31
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/9536 , G06F16/2457 , G06N3/0455 , G06N3/08
Abstract: 本说明书实施例提供的推荐方法、推荐模型的模型训练方法及设备,对历史行为序列中交互项的项标识与辅助信息进行融合;基于项标识信息、融合信息以及位置信息,通过位置解耦的融合自注意力模型确定各个交互项的融合项标识表征;基于各个交互项的融合项标识表征与候选项之间的匹配得分向用户推荐候选项。根据本说明书实施例的技术方案,能够消除位置信息与项标识、辅助信息之间的噪声干扰,并保留了项标识与辅助信息之间的强相关性,从而能够提高个性化推荐的准确性。
-
公开(公告)号:CN117608882A
公开(公告)日:2024-02-27
申请号:CN202311276419.5
申请日:2023-09-28
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F11/00
Abstract: 本说明书实施例公开了一种风险识别方法及系统。该方法包括:基于白皮书中的高可用指标,对采集的应用和业务的相关数据进行高可用指标提取;依据白皮书中的指标风险标准,检测得到异常指标,对应用和/或业务的风险贡献大的异常指标进行风险治理。其中,白皮书配置有归属不同应用和业务下的高可用指标、指标风险标准、风险等级。该系统基于上述方法实现。
-
-
公开(公告)号:CN116611499A
公开(公告)日:2023-08-18
申请号:CN202310536954.3
申请日:2023-05-11
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06N3/092 , G06F18/214 , G06Q30/0241 , G06Q30/0202 , G06Q30/0273
Abstract: 本说明书实施例披露一种训练用于自动出价的强化学习系统的方法及装置。其中强化学习系统包括环境模型和智能体,环境模型用于预测业务环境的状态分布,业务环境状态包括业务方的预算消耗和已获业务价值,智能体用于根据当前环境状态确定业务方的当前出价参数。所述方法包括:先利用多个历史样本训练环境模型,其中任意的第一历史样本包括业务环境的第一状态、第一出价参数,以及在第一状态下采用所述第一出价参数后业务环境变更为的第二状态;再利用基于环境状态空间和出价参数空间采样构建的多个状态‑出价参数对,以及将其中各个状态‑出价参数对输入训练好的环境模型而对应得到的预测状态分布,训练智能体。
-
公开(公告)号:CN116128581A
公开(公告)日:2023-05-16
申请号:CN202211261153.2
申请日:2022-10-14
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06Q30/06 , G06V10/74 , G06V10/10 , G06V10/762
Abstract: 本说明书提供的物品推荐方法和系统,在获取目标物品的属性信息和用户交互信息后,在属性信息中提取出相似性特征,得到显式相似性特征,并基于用户交互信息,确定与目标物品相似的至少一个物品,以得到隐式相似性特征,以及基于显式相似性特征和隐式相似性特征,确定目标物品对应的推荐模型的初始化参数,并基于初始化参数,采用推荐模型对目标物品进行推荐;该方案可以提升在冷启动下物品推荐的准确率。
-
公开(公告)号:CN113420879A
公开(公告)日:2021-09-21
申请号:CN202110782136.2
申请日:2021-07-09
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本公开提供了一种多任务学习模型的预测方法及装置,所述方法包括:利用掩码对嵌入向量进行加权,得到加权后的嵌入向量;将加权后的嵌入向量输入第一子网络层和第三子网络层,得到第一子网络层的第一输出向量和第三子网络层的第二输出向量;将第一输出向量和第二输出向量输入第二子网络层进行处理,得到第三输出向量,处理包括利用第二子网络层的中的第一编码变量对第一输出向量进行计算,利用第二子网络层的中的第二编码变量对第二输出向量进行计算,其中第一编码变量指示第一子网络层中神经元与第三子网络层中神经元之间的连接关系,第二编码变量指示第二子网络层中神经元与第三子网络层中神经元之间的连接关系。
-
公开(公告)号:CN111784419A
公开(公告)日:2020-10-16
申请号:CN202010735120.1
申请日:2020-07-28
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06Q30/02
Abstract: 本申请提供一种终端设备以及由所述终端设备执行的信息推送的方法,本申请提供一种服务器及由所述服务器执行的信息推送的方法,本申请还提供一种广告系统。所述信息推送的方法包括:接收来自目标终端设备的广告页面加载请求,所述广告页面包括:广告任务,以及完成所述广告任务可获得的权益值;根据所述页面加载请求从至少一个广告任务中确定目标广告任务;根据所述目标广告任务从至少一个权益值中确定目标权益值;以及向所述目标终端设备发送所述广告页面的数据,所述广告页面的数据包括所述目标广告任务和所述目标权益值。
-
公开(公告)号:CN111401963B
公开(公告)日:2022-06-07
申请号:CN202010202058.X
申请日:2020-03-20
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例提供一种训练用户行为预测模型的方法和装置,方法包括:获取多个训练样本,训练样本包括样本特征、第一标签、第二标签和第三标签,第一标签对应主任务,第二标签对应第一辅助任务,第三标签对应第二辅助任务;将各样本特征输入用户行为预测模型,基于主任务的预测输出和第一标签,第一辅助任务的预测输出和第二标签,第二辅助任务的预测输出和第三标签,采用多任务学习的方式训练用户行为预测模型;其中,主任务用于预测用户点击目标对象后发生预设行为的概率,第一辅助任务用于预测用户点击目标对象的概率,第二辅助任务用于预测用户点击目标对象并发生预设行为的概率。训练后的模型预测准确率高。
-
公开(公告)号:CN119964576A
公开(公告)日:2025-05-09
申请号:CN202510124955.6
申请日:2025-01-26
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书的实施例涉及用于训练语言模型的方法、装置、设备、介质和程序产品。该方法包括按照多个选择策略,从用户交互过的对象中选择多组对象。该方法还包括由语言模型基于多个选择策略和多组对象,确定是否向用户推荐目标对象的多个预测结果。该方法还包括基于多个预测结果,确定与多组对象相关的多个第一损失,多个第一损失用于训练语言模型。
-
-
-
-
-
-
-
-
-