Patent search ap:("支付宝(杭州)信息技术有限公司") AND inv:"都文龙" Page 1

1.

发明公开
训练语言模型的方法及装置审中-实审

公开(公告)号：CN119415957A

公开(公告)日：2025-02-11

申请号：CN202411545588.9

申请日：2024-10-31

Applicant: 支付宝(杭州)信息技术有限公司

Inventor： 李庆泉 , 都文龙 , 刘瑾

IPC: G06F18/214 , G06N3/094 , G06N3/084

Abstract: 本说明书实施例涉及训练大语言模型的方法及装置。首先，获取数据集，其中包含第一问题及其对应的第一拒答回答和第一不安全回答，并包含第二问题及其对应的第二正常回答；第一问题中包含违规内容；然后，构造训练集，包括第一样本、第二样本和第三样本；第一样本包含作为输入文本的第一问题、被标记为偏好输出的第一拒答回答和被标记为非偏好输出的第一不安全回答；第二样本包含作为输入文本的第二问题、被标记为偏好输出的第二正常回答和被标记为非偏好输出的第一拒答回答；第三样本包含作为输入文本的第二问题、被标记为偏好输出的第二正常回答和被标记为非偏好输出的第一不安全回答；最后，根据训练集，基于偏好优化算法训练大语言模型。

2.

发明公开
文本检测方法、装置、电子设备、存储介质及产品审中-实审

公开(公告)号：CN117149953A

公开(公告)日：2023-12-01

申请号：CN202311102327.5

申请日：2023-08-29

Applicant: 支付宝(杭州)信息技术有限公司

Inventor： 都文龙 , 李庆泉 , 张炳淑 , 周中军

IPC: G06F16/33 , G06F40/30 , G06F16/335 , G06N3/045 , G06F16/332 , G06F16/31 , G06F16/35

Abstract: 本说明书实施例提供了一种文本检测方法、装置、电子设备、计算机可读存储介质及计算机程序产品，该方法包括：基于数据检索模型对待检测文本进行检索，得到待检测文本的至少一个近邻文本；确定待检测文本与至少一个近邻文本的文本语义相似度和/或文本标签相似度；基于文本语义相似度和/或文本标签相似度，对至少一个近邻文本中的噪声文本进行过滤，得到对比文本；基于对比文本对待检测文本进行文本检测。

Patent Agency Ranking