-
公开(公告)号:CN120029673A
公开(公告)日:2025-05-23
申请号:CN202510389327.0
申请日:2025-03-28
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F9/318 , G06N5/04 , G06N3/045 , G06N3/08 , G06F18/241
Abstract: 本说明书实施例提供一种目标领域下的大模型微调方法和装置。方法包括:获取多个样本构成的训练数据集;任一样本包括输入文本和期望响应,所述输入文本包括所述目标领域的请求任务和执行所述请求任务的指令;所述期望响应包括标签思考路径、基于所述标签思考路径和检索到的若干文档得到的标签回答;所述标签思考路径包括所述请求任务的概念分类、基于所述概念分类确定的关联信息;利用所述训练数据集对大模型进行指令微调,以得到目标领域下的大模型。能够进一步提高大模型在垂直领域上的表现。
-
公开(公告)号:CN118037357A
公开(公告)日:2024-05-14
申请号:CN202410232756.2
申请日:2024-02-29
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06Q30/0242 , G06Q30/0241
Abstract: 本说明书一个或多个实施例提供一种流量控制方法、装置和电子设备,其中方法包括:获取被调控内容在多个流量渠道分别对应的目标参数和约束参数,所述目标参数是运筹优化模型中的目标函数计算时所需的参数,所述约束参数是所述运筹优化模型中的约束条件计算时所需的参数;基于所述目标参数和约束参数,求解所述运筹优化模型,得到所述运筹优化模型的最优解,以使得在所述最优解的情况下,所述目标函数的结果最优且满足所述约束条件的约束;所述约束条件包括:所述被调控内容在所述多个流量渠道全局的流量约束条件;基于所述最优解,确定所述被调控内容在各个流量渠道分别对应的目标分配流量。
-
公开(公告)号:CN118364180A
公开(公告)日:2024-07-19
申请号:CN202410627044.0
申请日:2024-05-17
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/9535 , G06F16/9538 , G06F16/958
Abstract: 本说明书提供的主题推荐的方法和系统,针对异构推荐目标的推荐场景。数据库中的P个集合对应S个推荐目标。P个集合中至少存在部分集合对应的推荐目标不同/异构。在接收到目标用户打开用于显示主题的目标页面的目标请求时,可以基于目标函数确定I个目标主题的主题分数,并基于I个目标主题的主题分数从中确定出推荐目标主题从而显示在目标页面上。所述目标函数是指以被推荐的主题对应的S个推荐目标的组合最大化为目的向包含目标用户的用户集合推荐A个主题,即每个目标主题的主题分数是在异构推荐目标的组合最大化的情况下确定的。因此,所述主题推荐的系统通过最大化多个不同推荐目标的组合,实现了异构推荐目标的推荐场景下的收益最大化。
-
-