Patent search ap:("支付宝(杭州)信息技术有限公司") AND inv:"杨敏" Page 1

1.

发明公开
用于训练语言模型的方法、装置、设备、介质和程序产品审中-公开

公开(公告)号：CN119964576A

公开(公告)日：2025-05-09

申请号：CN202510124955.6

申请日：2025-01-26

Applicant: 支付宝(杭州)信息技术有限公司

Inventor： 刘天赐 , 方飞腾 , 耿斌宗 , 沈彬 , 何勇 , 张亮 , 莫林剑 , 朱兴 , 杨敏

IPC: G10L17/04 , G10L15/06 , G10L15/18

Abstract: 本说明书的实施例涉及用于训练语言模型的方法、装置、设备、介质和程序产品。该方法包括按照多个选择策略，从用户交互过的对象中选择多组对象。该方法还包括由语言模型基于多个选择策略和多组对象，确定是否向用户推荐目标对象的多个预测结果。该方法还包括基于多个预测结果，确定与多组对象相关的多个第一损失，多个第一损失用于训练语言模型。

2.

发明公开
网络模型的训练方法、推荐方法、系统审中-实审

公开(公告)号：CN119538984A

公开(公告)日：2025-02-28

申请号：CN202411659120.2

申请日：2024-11-19

Applicant: 支付宝(杭州)信息技术有限公司

Inventor： 连肇瑞 , 耿斌宗 , 张雨 , 丁珂 , 郇兆鑫 , 沈彬 , 何勇 , 杨敏 , 张亮 , 莫林剑 , 朱兴

IPC: G06N3/0455 , G06N5/022 , G06N5/04 , G06N3/0895

Abstract: 本说明书提供一种网络模型的训练方法、推荐方法、系统，训练方法包括：获得样本数据集，基于大语言模型获得样本数据集对应的第一预测推荐结果，基于大语言模型和推荐模型获得样本数据集对应的第二预测推荐结果，以最小化第一预测推荐结果与预设第一标签之间的第一损失函数、第二预测推荐结果与预设第二标签之间的第二损失函数为训练目标更新所述预设网络的参数，得到目标网络模型，其中，预设第一标签为基于样本用户的丰富意图确定的。通过采用丰富意图确定大语言模型的预设第一标签，可以训练大语言模型辨别样本用户更深层次的用户意图的能力，从而使得训练得到的目标网络模型能够准确有效地为用户做推荐。

Patent Agency Ranking