-
公开(公告)号:CN115878432B
公开(公告)日:2023-05-12
申请号:CN202310122995.8
申请日:2023-02-16
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F11/30
Abstract: 本说明书提供了一种计算系统中的进程监控方法及相关设备。该计算系统包括多个计算设备,多个计算设备中的至少部分计算设备用于执行目标计算任务;至少部分计算设备上运行与目标计算任务对应的至少一个计算进程,并且,至少部分计算设备上部署了与至少一个计算进程绑定的代理程序。该方法应用于至少部分计算设备中的目标计算设备上部署的代理程序。该方法包括:从目标计算设备运行的至少一个计算进程中确定待监控的目标进程;获取目标进程在目标时长范围内对应的CPU利用率,并获取目标计算设备在目标时长范围内的总能耗;基于目标进程在目标时长范围内对应的CPU利用率和总能耗,获取目标计算设备在目标时长范围内运行目标进程产生的能耗。
-
公开(公告)号:CN118246505A
公开(公告)日:2024-06-25
申请号:CN202410089426.2
申请日:2024-01-22
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06N3/08 , G06N3/0442 , G06N3/042 , G06N3/045 , G06N3/096 , G06N3/0499 , G06N3/084
Abstract: 本说明书实施例提供一种大语言模型的训练方法及装置,以及一种预测模型的训练方法及装置。其中大语言模型的训练方法包括:首先,将训练样本的样本特征输入大语言模型,得到对应的预测结果;该训练样本包括自然语言文本,大语言模型包括混合专家神经网络MoE,所述MoE网络包括门控网络和多个专家网络。接着,基于所述预测结果和所述训练样本的样本标签,确定任务损失项;以及,基于所述多个专家网络对应的多个输出,确定蒸馏损失项;所述多个专家网络之间互为蒸馏学习中的学生和老师。之后,基于所述任务损失项和蒸馏损失项,训练所述大语言模型。
-
公开(公告)号:CN117973478A
公开(公告)日:2024-05-03
申请号:CN202410149071.1
申请日:2024-02-01
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06N3/08 , G06N3/0495
Abstract: 本说明书提供一种大语言模型的优化方法、装置、设备、介质及计算机程序产品。所述方法包括:根据大语言模型中量化后和量化前的目标矩阵的差异获得残差矩阵;根据与所述残差矩阵的第一列向量相似度最高的量化后的目标矩阵中的第二列向量,确定所述残差矩阵的稀疏基;根据所述稀疏基得到量化后的网络层的修正参数,所述修正参数用于对推理过程中所述量化后的网络层的输出数据进行修正。通过从目标矩阵中获得与网络层量化后与量化前的误差相似的参数组合,来对推理过程中该网络层的输出数据进行修正,可以使输出数据更接近于量化前网络层的输出数据,从而减小了量化误差,降低了量化效果损失。
-
公开(公告)号:CN117851355A
公开(公告)日:2024-04-09
申请号:CN202410039258.6
申请日:2024-01-10
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/172 , G06F16/182
Abstract: 本说明书一个或多个实施例提供一种用于边节点的数据缓存方法、装置、设备及介质。本说明书通过获取第一边节点在第一时间段内下发过、且下发次数大于第一次数阈值的第一数据,并获取位于第一边节点对应的预设地理区域内的第二边节点在第一时间段内下发过、且下发次数大于第一次数阈值的第二数据,从而确定第一数据、第二数据以及第一边节点已缓存的第三数据的预测命中概率,以便基于第一数据、第二数据以及第三数据中预测命中概率满足设定条件的目标数据,对第一边节点的缓存进行更新,以保证第一边节点的缓存中存储的为预测命中概率较高的数据,提高缓存命中率。
-
公开(公告)号:CN117725113A
公开(公告)日:2024-03-19
申请号:CN202311654784.5
申请日:2023-12-05
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/2458 , G06F16/28 , G06F16/242
Abstract: 本说明书的实施例提供了一种基于大语言模型的知识挖掘方法和装置。在该基于大语言模型的知识挖掘方法中,根据预定实体图谱,获取针对源实体的结构化知识;根据该源实体在该预定实体图谱中的目标属性确定候选关系集;利用大语言模型根据该结构化知识、该候选关系集和针对该源实体的附加知识,输出对应的目标关系集和可继承知识,其中,该可继承知识包括该目标关系集中的关系所对应的至少一个目标实体词;再利用大语言模型基于该源实体、该目标关系集中的关系和结构化知识、附加知识、可继承知识中的至少一项构建的提示信息,输出与所提供的关系对应的候选实体词集;进而,得到与该源实体相关联的实体和相应关系。
-
公开(公告)号:CN116610308B
公开(公告)日:2023-11-03
申请号:CN202310867712.2
申请日:2023-07-13
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书一个或多个实施例提供一种代码管理方法及装置、电子设备及存储介质,该方法包括:根据针对第一模型的脚本生成指令,获取代码库中通用代码和第一模型对应的专用代码,其中,第一模型为多个待检测模型中的任一个待检测模型;根据通用代码和第一模型对应的专用代码,生成第一模型对应的脚本。开发人员只需根据所有待检测模型的检测实验的共有逻辑开发通用代码,并根据每个待检测模型的检测实验的专有逻辑开发专用代码,相对于针对每个待检测模型的检测实验的完整逻辑开发代码,开发工作量较低;而且代码库中只需保存通用代码和各待检测模型的专用代码,内存占用量较低;再者可以很便捷的生成待检测模型的代码,提高了代码生成的效率。
-
公开(公告)号:CN116600020B
公开(公告)日:2023-10-10
申请号:CN202310865087.8
申请日:2023-07-13
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书一个或多个实施例提供一种协议生成方法、端云协同推荐方法及装置。该方法应用于协议生成器,协议生成器与云服务器和客户端通信连接,所述云服务器包括多个云上系统;所述方法包括:构建预设格式的协议模板,所述协议模板包括场景模块、策略模块和特征模块;根据待应用的推荐场景确定所述场景模块的场景参数,并根据所述多个云上系统的数据确定所述策略模块中的目标策略参数以及特征模块中的云特征,得到目标协议,所述目标协议用于使所述客户端根据所述目标协议进行端云协同资源推荐。通过根据端云协同推荐场景中的数据结构,构建通用的标准化数据协议,可以提高协议在客户端与不同云上系统之间的复用性,降低管理的复杂性和成本。
-
公开(公告)号:CN116611536B
公开(公告)日:2023-09-29
申请号:CN202310887452.5
申请日:2023-07-19
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书一个或多个实施例提供一种模型训练方法及装置、电子设备及存储介质,所述方法结合终端、边缘CND节点和云端三侧来完成目标模型的训练,从而提高了目标模型的训练效果,所述方法包括:接收多个梯度数据,其中,所述梯度数据由终端根据样本数据和目标模型生成,并发送至边缘CDN节点;对所述多个梯度数据进行聚合处理,得到第一聚合结果;将所述第一聚合结果发送至云端,以使所述云端根据所述第一聚合结果更新所述目标模型,并将更新后的所述目标模型发送至生成所述多个梯度数据的终端。
-
公开(公告)号:CN116610873B
公开(公告)日:2023-09-26
申请号:CN202310887568.9
申请日:2023-07-19
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/9535 , G06F16/9538 , G06F9/50 , G06N3/08 , G06N3/045
Abstract: 本说明书提供一种信息推荐方法及装置、存储介质,该方法包括:基于用户对云节点下发的至少一个第一推荐信息的操作行为,得到实时特征信息;将实时特征信息发送给边缘节点;接收并存储边缘节点返回的目标特征信息,目标特征信息是用于表征用户的历史操作行为和实时操作行为之间的共性的特征信息;基于目标特征信息,对云节点下发的至少一个第二推荐信息进行重排序后输出。本公开可以利用边缘节点的算力为客户端提供更精准表征用户操作行为的目标特征信息,扩展了客户端上表征用户操作行为的特征信息的丰富度,且可以减少信息推荐的时延,能够更合理的利用端边云各个设备的资源,提高了端边云架构的可用性。
-
公开(公告)号:CN116401567B
公开(公告)日:2023-09-08
申请号:CN202310653728.3
申请日:2023-06-02
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F18/231 , G06F18/22 , G06F16/9035 , G06F18/214
Abstract: 本说明书实施例提供了一种聚类模型训练、用户聚类、信息推送方法及装置。聚类模型包含父类簇和子类簇等多层类簇。聚类模型的待学习变量包括末端子类簇中心。在聚类模型的一次迭代训练中,通过聚类模型,从多层类簇的类簇中心中确定与用户特征匹配的末端子类簇中心,得到用户样本归属的末端子类簇。基于匹配的末端子类簇中心与用户特征之间的相似度确定预测损失,基于预测损失更新待学习变量。当聚类模型经过训练后,从中导出类簇标识与类簇中心的对应关系。该聚类模型可以确定新用户样本归属的类簇标识。在信息推送场景中,利用上述对应关系可以从用户标识查询到对应的类簇中心,将该类簇中心作为用户样本的特征向量,用于信息推送。
-
-
-
-
-
-
-
-
-