一种数据处理方法、装置及设备
    1.
    发明公开

    公开(公告)号:CN119441421A

    公开(公告)日:2025-02-14

    申请号:CN202411412538.3

    申请日:2024-10-10

    Abstract: 本说明书实施例公开了一种数据处理方法、装置及设备,该方法包括:接收用户输入的问题数据;将所述问题数据输入到预先训练的大语言模型中,得到所述问题数据对应的思维链,并基于所述问题数据对应的思维链构建查询数据;基于所述查询数据,通过预先训练的知识图谱检索模型从预设的知识数据库中检索与所述查询数据相匹配的知识图谱,并基于检索到的知识图谱构建所述查询数据对应的目标知识图谱;将所述查询数据对应的目标知识图谱转换为具有相同语义的预设格式的自然语言数据,并基于转换后的预设格式的自然语言数据,通过所述大语言模型确定所述问题数据对应的答案数据。

    用于对会话模型进行训练的方法及装置

    公开(公告)号:CN118245579A

    公开(公告)日:2024-06-25

    申请号:CN202410231534.9

    申请日:2024-02-29

    Abstract: 本说明书实施例提供了用于对会话模型进行训练的方法及装置。在该方法中,获取历史会话数据;按照以下方式进行模型训练,直至满足训练结束条件:从历史会话数据中筛选出目标回答语句中的目标被选回答语句所属的会话序列,历史会话序列由目标回答语句以及在目标回答语句生成之前按照时间顺序生成的用于推导出目标回答语句的各个查询语句和回答语句构成,未来会话序列由在目标回答语句生成之后按照时间顺序生成的由目标被选回答语句推导出的各个查询语句和回答语句构成;将历史会话序列和会话序列分别输入给第一会话模型和第二会话模型,以针对目标回答语句进行预测;以及结合第一会话模型和第二会话模型的预测结果进行模型调整。

    一种分布感知的多阶段大模型微调方法及装置

    公开(公告)号:CN119358625A

    公开(公告)日:2025-01-24

    申请号:CN202411378997.4

    申请日:2024-09-29

    Abstract: 本说明书实施例提供了一种分布感知的多阶段大模型微调方法及装置。待微调的大模型包括预训练后的骨干网络和预测层。在微调方法中,使用数据集中的样本对大模型进行第一训练,得到第一大模型,这里的第一训练包括:更新大模型中预测层的参数,不更新大模型中骨干网络的参数。接着,使用数据集中的样本对大模型进行第二训练,得到第二大模型,这里的第二训练包括:更新大模型中骨干网络的参数和预测层中的参数。这样,即得到了两个训练后的大模型,接着可以在两个训练后的大模型中的对应参数构成的范围内进行参数取值,得到微调后的大模型。数据集中包含隐私数据,在数据处理过程中需要进行隐私保护。

    检索方法、检索模型的训练方法、系统

    公开(公告)号:CN118427366A

    公开(公告)日:2024-08-02

    申请号:CN202410572352.8

    申请日:2024-05-09

    Abstract: 本说明书提供一种检索方法、检索模型的训练方法、系统,包括:获得目标搜索词,根据目标搜索词生成目标提示信息,其中,目标提示信息指示与目标搜索词对应的目标对象检索任务,根据预先训练的检索模型对目标提示信息进行预测,得到并输出与目标搜索词对应的目标检索对象,其中,检索模型是基于第一样本数据对目标大语言模型进行训练得到的,相对而言,本说明书提供的技术方案充分利用了大语言模型的强大能力,因此,可以既快速又深入地学习用户的输入和上下文,以快速且准确的理解搜索用户的需求和意图的能力,从而确定更加符合用户期望的检索结果,提升了用户的体验和满意度。

    相关性预测方法、相关性预测模型训练方法及装置和搜索系统

    公开(公告)号:CN117407587A

    公开(公告)日:2024-01-16

    申请号:CN202311370218.1

    申请日:2023-10-20

    Abstract: 本说明书实施例提供相关性预测方法、相关性预测模型训练方法及装置和搜索系统。在进行相关性预测时,经由表征生成层生成目标查询、目标项目、项目行为邻居集和查询行为邻居集的局部嵌入表示和全局嵌入表示;并经由表征融合层,将目标查询、目标项目、项目行为邻居集和查询行为邻居集的局部嵌入表示分别和对应的全局嵌入表示进行表征融合。经由相似度预测层,根据目标查询和目标项目的全局嵌入表示和各自的表征融合结果预测语义相似度,以及根据项目行为邻居集和查询行为邻居集的全局嵌入表示和各自的表征融合结果预测行为邻居相似度。然后,经由相关性预测层,根据语义相似度和行为邻居相似度预测目标查询和目标项目之间的相关性。

Patent Agency Ranking