小模型与语言模型协同增强的表格数据生成方法及装置

    公开(公告)号:CN120011427A

    公开(公告)日:2025-05-16

    申请号:CN202510023571.5

    申请日:2025-01-07

    Applicant: 复旦大学

    Abstract: 本发明提供了一种小模型与语言模型协同增强的表格数据生成方法及装置,具有这样的特征,包括步骤S2‑1,构建表格数据生成模型,并将原始训练数据集作为训练数据集;步骤S2‑2,通过表格数据生成模型生成训练数据集对应的训练合成数据,并根据训练合成数据和训练数据集优化表格数据生成模型;步骤S2‑3,判断是否达到预设终止条件,若是,则得到训练好的表格数据生成模型,若否,则进入步骤S2‑4;步骤S2‑4,通过训练好的小模型生成训练合成数据对应的辅助训练数据,并将原始训练数据集和辅助训练数据合并作为训练数据集,执行步骤S2‑2。总之,本方法能够生成更加真实的合成表格数据。

Patent Agency Ranking