-
公开(公告)号:CN118296387B
公开(公告)日:2024-08-06
申请号:CN202410718037.1
申请日:2024-06-05
Applicant: 烟台海颐软件股份有限公司
IPC: G06F18/214 , G06F18/24 , G06F16/33 , G06F16/332 , G06F16/35
Abstract: 基于模型双向迭代的训练样本的优化方法及其优化系统,涉及模型的样本训练领域。为了解决现有的小模型表达能力差、无法理解复杂问题、大模型处理速度慢、成本高的缺陷,本发明将提示词库输入到大模型中输出标签集合;生成训练样本集合;将标签集合和总训练样本集合输入下游小模型进行任务训练,获得下游任务模型;将验证结果错误对应的真实数据与训练样本集合进行组合,过滤劣质数据,优化训练样本集合;重复优化直到通过率达到预设阈值时完成第一次数据质量优化迭代,增加训练样本的数量重复优化迭代,直到所有标注的真实数据的验证通过率均达到预设阈值时,获得验证通过的下游任务模型。本发明主要用于优化模型的训练样本方法。
-
公开(公告)号:CN118296387A
公开(公告)日:2024-07-05
申请号:CN202410718037.1
申请日:2024-06-05
Applicant: 烟台海颐软件股份有限公司
IPC: G06F18/214 , G06F18/24 , G06F16/33 , G06F16/332 , G06F16/35
Abstract: 基于模型双向迭代的训练样本的优化方法及其优化系统,涉及模型的样本训练领域。为了解决现有的小模型表达能力差、无法理解复杂问题、大模型处理速度慢、成本高的缺陷,本发明将提示词库输入到大模型中输出标签集合;生成训练样本集合;将标签集合和总训练样本集合输入下游小模型进行任务训练,获得下游任务模型;将验证结果错误对应的真实数据与训练样本集合进行组合,过滤劣质数据,优化训练样本集合;重复优化直到通过率达到预设阈值时完成第一次数据质量优化迭代,增加训练样本的数量重复优化迭代,直到所有标注的真实数据的验证通过率均达到预设阈值时,获得验证通过的下游任务模型。本发明主要用于优化模型的训练样本方法。
-