-
公开(公告)号:CN117332247B
公开(公告)日:2024-02-23
申请号:CN202311635874.X
申请日:2023-12-01
Applicant: 苏州大学
IPC: G06F18/21 , G06F18/214 , G06N3/0455 , G06N3/0499 , G06N3/0442 , G06N3/082 , G06N3/084
Abstract: 本发明公开了以大语言模型为媒介的大数据交易和质量评估方法及系统,涉及数据交易与评估技术领域,包括:各个公司利用私有数据建立指令微调数据集,并根据指令微调数据集独立训练大语言模型;基于混合专家系统将各个公司训练好的大语言模型整合为完整的行业大语言模型;利用行业大语言模型代替数据的直接交易,并对行业大语言模型的效果进行质量评估;相对于联邦学习方案本发明不需要在参与方间进行频繁的模型参数更新通信,因此性能更高,安全性更强;且本发明利用大语言模型生成答案,可以使评估方法更具通用性,适用于多样化的大数据场景,也降低非专业人士对数据质量评估的门槛,使更多人能够准确评估数据质量。
-
公开(公告)号:CN117332247A
公开(公告)日:2024-01-02
申请号:CN202311635874.X
申请日:2023-12-01
Applicant: 苏州大学
IPC: G06F18/21 , G06F18/214 , G06N3/0455 , G06N3/0499 , G06N3/0442 , G06N3/082 , G06N3/084
Abstract: 本发明公开了以大语言模型为媒介的大数据交易和质量评估方法及系统,涉及数据交易与评估技术领域,包括:各个公司利用私有数据建立指令微调数据集,并根据指令微调数据集独立训练大语言模型;基于混合专家系统将各个公司训练好的大语言模型整合为完整的行业大语言模型;利用行业大语言模型代替数据的直接交易,并对行业大语言模型的效果进行质量评估;相对于联邦学习方案本发明不需要在参与方间进行频繁的模型参数更新通信,因此性能更高,安全性更强;且本发明利用大语言模型生成答案,可以使评估方法更具通用性,适用于多样化的大数据场景,也降低非专业人士对数据质量评估的门槛,使更多人能够准确评估数据质量。
-