-
公开(公告)号:CN117331835A
公开(公告)日:2024-01-02
申请号:CN202311322798.7
申请日:2023-10-12
Applicant: 复旦大学
IPC: G06F11/36 , G06F16/2452
Abstract: 本发明涉及数据集的处理方法,包括:接收多个第一SQL语句‑自然语言对;对于每个所述第一SQL语句‑自然语言对,将其中的第一SQL语句切分为SQL语句单元,将其中的第一自然语言切分为自然语言单元,并将所述SQL语句单元和所述自然语言单元对齐;将多个所述SQL语句单元和对齐的所述自然语言单元组合为多个第二SQL语句‑自然语言对;将多个所述第二SQL语句‑自然语言对分为训练集和测试集。本发明还涉及SQL‑自然语言翻译模型的测试的方法、数据集的处理和SQL‑自然语言翻译模型的测试装置,以及计算设备集群、计算机程序产品和介质。
-
公开(公告)号:CN117648379A
公开(公告)日:2024-03-05
申请号:CN202311675728.X
申请日:2023-12-07
Applicant: 复旦大学 , 星环信息科技(上海) , 股份有限公司
Abstract: 本发明提供对不同协议的时序数据进行采集和同步的方法、装置,应用于客户端,方法包括:基于一个或多个设备各自的元数据,对每个设备进行初始化,并为每个设备生成虚拟影子设备,元数据包括对协议、产品和设备的描述信息,产品由数字化的物模型表示;根据接收到的采集指令,确定对应的虚拟影子设备,使对应的虚拟影子设备通过预定义接口,从使用对应协议的指定设备采集时序数据;基于物模型,将时序数据转换为预定义数据格式,并利用MQTT协议进行封装后传输到时序数据库;通过预定义数据库接口,将时序数据同步到云端数据库。本发明在数据采集与同步中,增加协议兼容性,实现异构数据库同步能力,提高云边同步效率,减少云边数据同步所需的数据传输。
-