-
公开(公告)号:CN120011427A
公开(公告)日:2025-05-16
申请号:CN202510023571.5
申请日:2025-01-07
Applicant: 复旦大学
IPC: G06F16/248 , G06F40/174 , G06F40/177 , G06N3/0455 , G06N3/0475 , G06N3/092 , G06N5/04
Abstract: 本发明提供了一种小模型与语言模型协同增强的表格数据生成方法及装置,具有这样的特征,包括步骤S2‑1,构建表格数据生成模型,并将原始训练数据集作为训练数据集;步骤S2‑2,通过表格数据生成模型生成训练数据集对应的训练合成数据,并根据训练合成数据和训练数据集优化表格数据生成模型;步骤S2‑3,判断是否达到预设终止条件,若是,则得到训练好的表格数据生成模型,若否,则进入步骤S2‑4;步骤S2‑4,通过训练好的小模型生成训练合成数据对应的辅助训练数据,并将原始训练数据集和辅助训练数据合并作为训练数据集,执行步骤S2‑2。总之,本方法能够生成更加真实的合成表格数据。
-
公开(公告)号:CN120012733A
公开(公告)日:2025-05-16
申请号:CN202510023574.9
申请日:2025-01-07
Applicant: 复旦大学
IPC: G06F40/177 , G06F40/16 , G06N3/0455 , G06N3/0475 , G06N3/094
Abstract: 本发明提供了一种基于语言模型对抗数据增强的表格数据生成方法及装置,具有这样的特征,包括:步骤S1,构建鉴别器和生成器,并根据多个训练表格数据构建的原始训练数据集对鉴别器和生成器进行训练,得到训练好的生成器作为表格数据生成模型;步骤S2,对现有表格数据进行预处理,得到预处理数据;步骤S3,将预处理数据输入表格数据生成模型,得到合成表格数据。总之,本方法能够生成更加真实且高质量的合成表格数据。
-