Patent search ap:("烟台海颐软件股份有限公司") AND inv:"王斌一" Page 1

1.

发明授权
基于模型双向迭代的训练样本的优化方法及其优化系统有权

公开(公告)号：CN118296387B

公开(公告)日：2024-08-06

申请号：CN202410718037.1

申请日：2024-06-05

Applicant: 烟台海颐软件股份有限公司

Inventor： 刘玉军 , 杜洋 , 柯晶晶 , 王斌一 , 杨正琦

IPC: G06F18/214 , G06F18/24 , G06F16/33 , G06F16/332 , G06F16/35

Abstract: 基于模型双向迭代的训练样本的优化方法及其优化系统，涉及模型的样本训练领域。为了解决现有的小模型表达能力差、无法理解复杂问题、大模型处理速度慢、成本高的缺陷，本发明将提示词库输入到大模型中输出标签集合；生成训练样本集合；将标签集合和总训练样本集合输入下游小模型进行任务训练，获得下游任务模型；将验证结果错误对应的真实数据与训练样本集合进行组合，过滤劣质数据，优化训练样本集合；重复优化直到通过率达到预设阈值时完成第一次数据质量优化迭代，增加训练样本的数量重复优化迭代，直到所有标注的真实数据的验证通过率均达到预设阈值时，获得验证通过的下游任务模型。本发明主要用于优化模型的训练样本方法。

2.

发明公开
基于模型双向迭代的训练样本的优化方法及其优化系统有权

公开(公告)号：CN118296387A

公开(公告)日：2024-07-05

申请号：CN202410718037.1

申请日：2024-06-05

Applicant: 烟台海颐软件股份有限公司

Inventor： 刘玉军 , 杜洋 , 柯晶晶 , 王斌一 , 杨正琦

IPC: G06F18/214 , G06F18/24 , G06F16/33 , G06F16/332 , G06F16/35

Abstract: 基于模型双向迭代的训练样本的优化方法及其优化系统，涉及模型的样本训练领域。为了解决现有的小模型表达能力差、无法理解复杂问题、大模型处理速度慢、成本高的缺陷，本发明将提示词库输入到大模型中输出标签集合；生成训练样本集合；将标签集合和总训练样本集合输入下游小模型进行任务训练，获得下游任务模型；将验证结果错误对应的真实数据与训练样本集合进行组合，过滤劣质数据，优化训练样本集合；重复优化直到通过率达到预设阈值时完成第一次数据质量优化迭代，增加训练样本的数量重复优化迭代，直到所有标注的真实数据的验证通过率均达到预设阈值时，获得验证通过的下游任务模型。本发明主要用于优化模型的训练样本方法。

Patent Agency Ranking