基于模型双向迭代的训练样本的优化方法及其优化系统

    公开(公告)号:CN118296387B

    公开(公告)日:2024-08-06

    申请号:CN202410718037.1

    申请日:2024-06-05

    Abstract: 基于模型双向迭代的训练样本的优化方法及其优化系统,涉及模型的样本训练领域。为了解决现有的小模型表达能力差、无法理解复杂问题、大模型处理速度慢、成本高的缺陷,本发明将提示词库输入到大模型中输出标签集合;生成训练样本集合;将标签集合和总训练样本集合输入下游小模型进行任务训练,获得下游任务模型;将验证结果错误对应的真实数据与训练样本集合进行组合,过滤劣质数据,优化训练样本集合;重复优化直到通过率达到预设阈值时完成第一次数据质量优化迭代,增加训练样本的数量重复优化迭代,直到所有标注的真实数据的验证通过率均达到预设阈值时,获得验证通过的下游任务模型。本发明主要用于优化模型的训练样本方法。

    基于模型双向迭代的训练样本的优化方法及其优化系统

    公开(公告)号:CN118296387A

    公开(公告)日:2024-07-05

    申请号:CN202410718037.1

    申请日:2024-06-05

    Abstract: 基于模型双向迭代的训练样本的优化方法及其优化系统,涉及模型的样本训练领域。为了解决现有的小模型表达能力差、无法理解复杂问题、大模型处理速度慢、成本高的缺陷,本发明将提示词库输入到大模型中输出标签集合;生成训练样本集合;将标签集合和总训练样本集合输入下游小模型进行任务训练,获得下游任务模型;将验证结果错误对应的真实数据与训练样本集合进行组合,过滤劣质数据,优化训练样本集合;重复优化直到通过率达到预设阈值时完成第一次数据质量优化迭代,增加训练样本的数量重复优化迭代,直到所有标注的真实数据的验证通过率均达到预设阈值时,获得验证通过的下游任务模型。本发明主要用于优化模型的训练样本方法。

Patent Agency Ranking