一种分布感知的多阶段大模型微调方法及装置

    公开(公告)号:CN119358625A

    公开(公告)日:2025-01-24

    申请号:CN202411378997.4

    申请日:2024-09-29

    Abstract: 本说明书实施例提供了一种分布感知的多阶段大模型微调方法及装置。待微调的大模型包括预训练后的骨干网络和预测层。在微调方法中,使用数据集中的样本对大模型进行第一训练,得到第一大模型,这里的第一训练包括:更新大模型中预测层的参数,不更新大模型中骨干网络的参数。接着,使用数据集中的样本对大模型进行第二训练,得到第二大模型,这里的第二训练包括:更新大模型中骨干网络的参数和预测层中的参数。这样,即得到了两个训练后的大模型,接着可以在两个训练后的大模型中的对应参数构成的范围内进行参数取值,得到微调后的大模型。数据集中包含隐私数据,在数据处理过程中需要进行隐私保护。

    一种数据处理方法、装置及设备
    2.
    发明公开

    公开(公告)号:CN119441421A

    公开(公告)日:2025-02-14

    申请号:CN202411412538.3

    申请日:2024-10-10

    Abstract: 本说明书实施例公开了一种数据处理方法、装置及设备,该方法包括:接收用户输入的问题数据;将所述问题数据输入到预先训练的大语言模型中,得到所述问题数据对应的思维链,并基于所述问题数据对应的思维链构建查询数据;基于所述查询数据,通过预先训练的知识图谱检索模型从预设的知识数据库中检索与所述查询数据相匹配的知识图谱,并基于检索到的知识图谱构建所述查询数据对应的目标知识图谱;将所述查询数据对应的目标知识图谱转换为具有相同语义的预设格式的自然语言数据,并基于转换后的预设格式的自然语言数据,通过所述大语言模型确定所述问题数据对应的答案数据。

    一种数据质量控制方法、装置以及设备

    公开(公告)号:CN117033354A

    公开(公告)日:2023-11-10

    申请号:CN202310899090.1

    申请日:2023-07-20

    Inventor: 周源 吴云广

    Abstract: 本说明书实施例公开了一种数据质量控制方法、装置以及设备。方案包括:从数据表中提取字段集合;通过判断所述字段集合中的字段是否被消费,生成被消费字段子集合;根据所述被消费字段子集合中的被消费字段是否已配置了字段级布防规则,控制所述数据表的数据质量。以解决需要更有助于保障数据质量的方案的问题,通过进行更细粒度的字段级布防,从而能够直接对数据的属性进行规则防护,并且从当前获取的全部字段中筛选出了更有可能影响数据质量的被消费字段,来做布防或者衡量当前布防的覆盖度,从而能够更直观地从全局掌握以及控制数据质量,因此能够更好地保障数据质量。

Patent Agency Ranking