-
公开(公告)号:CN118195066A
公开(公告)日:2024-06-14
申请号:CN202410298561.8
申请日:2024-03-15
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06Q10/04 , G06F9/48 , G06F9/50 , G06N3/0455 , G06N3/08
Abstract: 本说明书实施例提供了用于对资源进行弹性调度的方法及装置。在该方法中,基于历史流量数据对未来指定时间段的流量进行预测,以得到针对未来指定时间段的预测流量;获取资源利用率预估模型,其中,资源利用率预估模型根据未来指定时间段的上一历史时间段内的真实资源利用率和预估资源利用率进行模型参数调整后得到;根据预测流量和资源利用率预估模型构建优化模型,其中,优化模型在满足约束条件的情况下使得预估资源利用率与资源利用率阈值之间的差值最小化;以及求解优化模型,得到未来指定时间段内的资源调整量,以使资源根据资源调整量进行调整。
-
公开(公告)号:CN117687794A
公开(公告)日:2024-03-12
申请号:CN202410058320.6
申请日:2024-01-15
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例提供了针对应用容器的资源调度方法及装置。该方法包括:获取为第一应用分配的在第一时刻的目标资源量;确定各个机器当前的可用资源量;将该各个机器和未使用的单个新机器按照当前可用资源量从小到大排序,基于该目标资源量,按第一算法估算出第j*个机器,进而估算出共计g个机器进行可用资源量的分配;其中j*和g是自然数,且g是按第一算法基于该第j*个机器当前的可用资源量得到的满足该目标资源量的最小总机器数。
-
公开(公告)号:CN116684480A
公开(公告)日:2023-09-01
申请号:CN202310948354.8
申请日:2023-07-28
Applicant: 支付宝(杭州)信息技术有限公司
IPC: H04L67/55 , G06F16/9535 , G06F18/214
Abstract: 本发明涉及一种信息推送模型的确定及信息推送的方法及装置,在模型构建过程中,采用多输入多输出模型作为初始模型,通过样本特征深度提取多输入向量,同时产出多层次丰富的输出表征,并根据初始模型的训练结果对初始模型中的连接关系进行删减。其中,初始模型包括依次连接的第一数量的网络层,单个网络层的输出作为其后的第二数量网络层的输入。如此训练得到的模型可以具有更加有效的拓扑结构。
-
公开(公告)号:CN119922239A
公开(公告)日:2025-05-02
申请号:CN202510080646.3
申请日:2025-01-17
Applicant: 支付宝(杭州)信息技术有限公司
IPC: H04L67/60 , G06Q30/0251 , G06Q30/0241
Abstract: 本说明书实施例提供一种针对非平稳请求的在线分配方法和装置,方法包括:获取当前在线分配的预设参数;将n个在线请求对应的总时长分成T个时段,每个时段分割为探索阶段和利用阶段;在探索阶段,基于历史数据计算的当前时段的资源先验分配向量和预设参数,对当前时段的前N0个在线请求进行决策,同时收集该阶段的N0个在线请求样本;在利用阶段,基于收集到的N0个在线请求样本,计算当前时段的资源后验分配向量,同时根据当前时段之前的各个时段的累积资源和估计的累积资源,对当前时段的资源后验分配向量进行更新,得到目标资源分配向量,基于目标资源分配向量和预设参数对剩余的在线请求进行决策。
-
公开(公告)号:CN119829288A
公开(公告)日:2025-04-15
申请号:CN202411908815.X
申请日:2024-12-23
Applicant: 浙江大学 , 支付宝(杭州)信息技术有限公司
IPC: G06F9/50
Abstract: 本申请提供了确定计算节点的方法、装置和设备。方案包括:首先,根据待分配的负载单元集合中各负载单元的资源需求量,将所述负载单元集合划分为至少两个负载类,同一负载类中包含的负载单元的资源需求量的极差小于或等于预设资源量阈值;然后,采用多优化目标的规划模型,确定每个负载类在各个计算节点的负载单元分配数量,所述多优化目标包括针对负载迁移成本的第一优化目标、针对节点负载均衡度的第二优化目标以及针对计算节点成本的第三优化目标;之后,再根据所述负载单元分配数量,确定承载所述负载单元集合中各负载单元的计算节点。
-
公开(公告)号:CN118229433A
公开(公告)日:2024-06-21
申请号:CN202410425214.7
申请日:2024-04-09
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本公开提供一种数据驱动的组合决策模型参数更新方法和系统,包括:获得离线数据集,根据离线数据集对初始组合决策模型的当前模型参数进行迭代优化,得到满足预设结束迭代优化条件的目标模型参数,在第i次迭代优化中包括:根据离线数据集和第i次模型参数确定约束违反程度,并根据约束违反程度和离线数据集确定第i+1次模型参数,即提供了一种非梯度法对初始组合决策模型的模型参数进行更新的方法和系统,避免了相关技术中基于梯度法更新造成的收敛效率低的弊端,提高了模型参数更新的效率,且通过结合离线数据集中的历史组合决策相关信息确定约束违反程度,以使得目标组合决策模型的约束违反程度满足全局约束需求,从而提高组合决策的有效性和可靠性。
-
公开(公告)号:CN116401567B
公开(公告)日:2023-09-08
申请号:CN202310653728.3
申请日:2023-06-02
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F18/231 , G06F18/22 , G06F16/9035 , G06F18/214
Abstract: 本说明书实施例提供了一种聚类模型训练、用户聚类、信息推送方法及装置。聚类模型包含父类簇和子类簇等多层类簇。聚类模型的待学习变量包括末端子类簇中心。在聚类模型的一次迭代训练中,通过聚类模型,从多层类簇的类簇中心中确定与用户特征匹配的末端子类簇中心,得到用户样本归属的末端子类簇。基于匹配的末端子类簇中心与用户特征之间的相似度确定预测损失,基于预测损失更新待学习变量。当聚类模型经过训练后,从中导出类簇标识与类簇中心的对应关系。该聚类模型可以确定新用户样本归属的类簇标识。在信息推送场景中,利用上述对应关系可以从用户标识查询到对应的类簇中心,将该类簇中心作为用户样本的特征向量,用于信息推送。
-
公开(公告)号:CN116384473A
公开(公告)日:2023-07-04
申请号:CN202310652126.6
申请日:2023-06-02
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06N3/082 , G06F16/9535
Abstract: 本说明书实施例提供了一种计算图改进、信息推送方法及装置。信息推送模型用于针对用户确定多条待选推送信息的评分。在该方法中,获取用户特征和待选推送信息特征,并据此特征对计算图的特征输入节点和其他节点进行类别标记,标记为与用户特征相关联的第一类,或者与待选推送信息特征相关联的第二类。接着,在属于第一类的特征输入节点与其下游节点之间增加切分节点,切分节点可以对输入的高维数据进行切分,并输出得到的低维数据。还要从其他节点中确定自身类别为第一类、其下游节点的类别为第二类的节点,作为用户特征叶节点。接着,在用户特征叶节点与其下游节点之间增加复制节点,复制节点对输入的低维数据进行复制,输出得到的高维数据。
-
公开(公告)号:CN116383458A
公开(公告)日:2023-07-04
申请号:CN202310650591.6
申请日:2023-06-02
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/9035 , G06Q30/0601
Abstract: 本说明书实施例提供一种信息推送的方法及装置,在信息推送的排序过程中将用于粗排的第一子网络和用于精排的第二子网络同时连接在嵌入模块之后,并增加动态选择模块完成第一子网络至第二子网络的连接,从而,在信息推送过程中在一个模型架构下完成信息排序,可以减少模型调用次数,且嵌入模块的嵌入结果可以由第一子网络和第二子网络共用。在信息推送过程中,先由第一子网络对候选信息进行粗排过滤,从而经由动态选择模块选择不固定条数的候选信息作为优选信息进行精排打分,之后,将优选信息的精排打分和其他候选信息的粗排打分结果一起进行融合排序,以按照打分结果进行信息推送。如此,可以提高信息推送的处理效率。
-
公开(公告)号:CN116011593B
公开(公告)日:2023-06-16
申请号:CN202310253084.9
申请日:2023-03-09
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例提供一种网络模型能耗的确定方法及装置,该方法包括:获取目标网络模型在训练过程的训练浮点计算总量;获取目标网络模型的当前调用量,当前调用量表示调用目标网络模型执行业务预测任务的次数;基于当前调用量及目标网络模型在单次业务预测任务执行过程的第一浮点计算量,确定预测浮点计算总量;基于训练浮点计算总量和预测浮点计算总量,确定目标网络模型的当前能耗量。
-
-
-
-
-
-
-
-
-