-
公开(公告)号:CN119441421A
公开(公告)日:2025-02-14
申请号:CN202411412538.3
申请日:2024-10-10
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/3329 , G06F16/334 , G06F16/36 , G06F40/30 , G06N5/022
Abstract: 本说明书实施例公开了一种数据处理方法、装置及设备,该方法包括:接收用户输入的问题数据;将所述问题数据输入到预先训练的大语言模型中,得到所述问题数据对应的思维链,并基于所述问题数据对应的思维链构建查询数据;基于所述查询数据,通过预先训练的知识图谱检索模型从预设的知识数据库中检索与所述查询数据相匹配的知识图谱,并基于检索到的知识图谱构建所述查询数据对应的目标知识图谱;将所述查询数据对应的目标知识图谱转换为具有相同语义的预设格式的自然语言数据,并基于转换后的预设格式的自然语言数据,通过所述大语言模型确定所述问题数据对应的答案数据。
-
公开(公告)号:CN118245579A
公开(公告)日:2024-06-25
申请号:CN202410231534.9
申请日:2024-02-29
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/332 , G06F16/335 , G06N20/00
Abstract: 本说明书实施例提供了用于对会话模型进行训练的方法及装置。在该方法中,获取历史会话数据;按照以下方式进行模型训练,直至满足训练结束条件:从历史会话数据中筛选出目标回答语句中的目标被选回答语句所属的会话序列,历史会话序列由目标回答语句以及在目标回答语句生成之前按照时间顺序生成的用于推导出目标回答语句的各个查询语句和回答语句构成,未来会话序列由在目标回答语句生成之后按照时间顺序生成的由目标被选回答语句推导出的各个查询语句和回答语句构成;将历史会话序列和会话序列分别输入给第一会话模型和第二会话模型,以针对目标回答语句进行预测;以及结合第一会话模型和第二会话模型的预测结果进行模型调整。
-
公开(公告)号:CN119807489A
公开(公告)日:2025-04-11
申请号:CN202411997061.X
申请日:2024-12-31
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/903 , G06F16/9038 , G06F16/9032 , G06N5/022 , G06N3/0455
Abstract: 本说明书实施例提供了一种确定查询‑项目对的相关性的方法及装置。该方法包括:基于目标搜索引擎的用户的历史行为数据,获取目标查询‑目标项目对的邻居集合,所述邻居集合包括以下至少一个集合:所述目标查询对应的第一项目的第一集合,所述目标项目对应的第一查询的第二集合;基于所述目标查询‑目标项目对和所述邻居集合,构建目标提示信息;将所述目标提示信息输入大语言模型,得到所述大语言模型输出的所述目标查询‑目标项目对的相关性分数。
-
公开(公告)号:CN119358625A
公开(公告)日:2025-01-24
申请号:CN202411378997.4
申请日:2024-09-29
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06N3/082 , G06N3/0895 , G06N3/098 , G06N3/045
Abstract: 本说明书实施例提供了一种分布感知的多阶段大模型微调方法及装置。待微调的大模型包括预训练后的骨干网络和预测层。在微调方法中,使用数据集中的样本对大模型进行第一训练,得到第一大模型,这里的第一训练包括:更新大模型中预测层的参数,不更新大模型中骨干网络的参数。接着,使用数据集中的样本对大模型进行第二训练,得到第二大模型,这里的第二训练包括:更新大模型中骨干网络的参数和预测层中的参数。这样,即得到了两个训练后的大模型,接着可以在两个训练后的大模型中的对应参数构成的范围内进行参数取值,得到微调后的大模型。数据集中包含隐私数据,在数据处理过程中需要进行隐私保护。
-
公开(公告)号:CN118427366A
公开(公告)日:2024-08-02
申请号:CN202410572352.8
申请日:2024-05-09
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/383 , G06F18/214
Abstract: 本说明书提供一种检索方法、检索模型的训练方法、系统,包括:获得目标搜索词,根据目标搜索词生成目标提示信息,其中,目标提示信息指示与目标搜索词对应的目标对象检索任务,根据预先训练的检索模型对目标提示信息进行预测,得到并输出与目标搜索词对应的目标检索对象,其中,检索模型是基于第一样本数据对目标大语言模型进行训练得到的,相对而言,本说明书提供的技术方案充分利用了大语言模型的强大能力,因此,可以既快速又深入地学习用户的输入和上下文,以快速且准确的理解搜索用户的需求和意图的能力,从而确定更加符合用户期望的检索结果,提升了用户的体验和满意度。
-
公开(公告)号:CN117407587A
公开(公告)日:2024-01-16
申请号:CN202311370218.1
申请日:2023-10-20
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/9535 , G06F18/22 , G06F18/25
Abstract: 本说明书实施例提供相关性预测方法、相关性预测模型训练方法及装置和搜索系统。在进行相关性预测时,经由表征生成层生成目标查询、目标项目、项目行为邻居集和查询行为邻居集的局部嵌入表示和全局嵌入表示;并经由表征融合层,将目标查询、目标项目、项目行为邻居集和查询行为邻居集的局部嵌入表示分别和对应的全局嵌入表示进行表征融合。经由相似度预测层,根据目标查询和目标项目的全局嵌入表示和各自的表征融合结果预测语义相似度,以及根据项目行为邻居集和查询行为邻居集的全局嵌入表示和各自的表征融合结果预测行为邻居相似度。然后,经由相关性预测层,根据语义相似度和行为邻居相似度预测目标查询和目标项目之间的相关性。
-
公开(公告)号:CN116881520A
公开(公告)日:2023-10-13
申请号:CN202310896764.2
申请日:2023-07-20
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/9035 , G06F16/903 , G06F18/25 , G06V20/40 , G06F40/30
Abstract: 本说明书的实施例提供基于偏序的内容检索模型训练方法、内容检索方法及装置。在进行模型训练时,提取第一内容和第二内容的全局特征表征和局部特征表征,所提取的局部特征表征包括对内容进行内容切分而得到的内容片段的内容片段特征表征。通过跨内容特征交互来根据第一内容和第二内容的局部特征表征生成第一内容和第二内容的语义偏序表征;并且使用第一内容和第二内容的全局特征表征和语义偏序表征来对内容检索模型进行基于偏序对比学习的模型训练。
-
-
-
-
-
-