-
公开(公告)号:CN119415957A
公开(公告)日:2025-02-11
申请号:CN202411545588.9
申请日:2024-10-31
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F18/214 , G06N3/094 , G06N3/084
Abstract: 本说明书实施例涉及训练大语言模型的方法及装置。首先,获取数据集,其中包含第一问题及其对应的第一拒答回答和第一不安全回答,并包含第二问题及其对应的第二正常回答;第一问题中包含违规内容;然后,构造训练集,包括第一样本、第二样本和第三样本;第一样本包含作为输入文本的第一问题、被标记为偏好输出的第一拒答回答和被标记为非偏好输出的第一不安全回答;第二样本包含作为输入文本的第二问题、被标记为偏好输出的第二正常回答和被标记为非偏好输出的第一拒答回答;第三样本包含作为输入文本的第二问题、被标记为偏好输出的第二正常回答和被标记为非偏好输出的第一不安全回答;最后,根据训练集,基于偏好优化算法训练大语言模型。
-
公开(公告)号:CN117149953A
公开(公告)日:2023-12-01
申请号:CN202311102327.5
申请日:2023-08-29
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/33 , G06F40/30 , G06F16/335 , G06N3/045 , G06F16/332 , G06F16/31 , G06F16/35
Abstract: 本说明书实施例提供了一种文本检测方法、装置、电子设备、计算机可读存储介质及计算机程序产品,该方法包括:基于数据检索模型对待检测文本进行检索,得到待检测文本的至少一个近邻文本;确定待检测文本与至少一个近邻文本的文本语义相似度和/或文本标签相似度;基于文本语义相似度和/或文本标签相似度,对至少一个近邻文本中的噪声文本进行过滤,得到对比文本;基于对比文本对待检测文本进行文本检测。
-