一种结构化仿真数据生成系统及生成方法

    公开(公告)号:CN115169252A

    公开(公告)日:2022-10-11

    申请号:CN202211086686.1

    申请日:2022-09-07

    Abstract: 本发明公开了一种结构化仿真数据生成系统及生成方法,所述系统包括数据预处理单元以及训练和生成单元,所述数据预处理单元用于将原始数据中的每个样本转换成向量表示,并且在转换的过程中建模贝叶斯网络用以描述特征间的关联关系;所述训练和生成单元利用原始数据转换后的向量表示进行训练,得到仿真数据生成模型,利用所述仿真数据生成模型生成仿真数据记录。本发明系统和方法能够同时生成含有连续型特征和离散型特征的仿真数据记录;针对生成仿真数据,既保持了与原始数据一致的数据分布,也保证了与原始数据一致的特征间关联关系;同时提出一种根据所需条件生成仿真数据的方法,能够根据不同的仿真数据应用场景生成分析所需的仿真数据记录。

    一种结构化仿真数据生成系统及生成方法

    公开(公告)号:CN115169252B

    公开(公告)日:2022-12-13

    申请号:CN202211086686.1

    申请日:2022-09-07

    Abstract: 本发明公开了一种结构化仿真数据生成系统及生成方法,所述系统包括数据预处理单元以及训练和生成单元,所述数据预处理单元用于将原始数据中的每个样本转换成向量表示,并且在转换的过程中建模贝叶斯网络用以描述特征间的关联关系;所述训练和生成单元利用原始数据转换后的向量表示进行训练,得到仿真数据生成模型,利用所述仿真数据生成模型生成仿真数据记录。本发明系统和方法能够同时生成含有连续型特征和离散型特征的仿真数据记录;针对生成仿真数据,既保持了与原始数据一致的数据分布,也保证了与原始数据一致的特征间关联关系;同时提出一种根据所需条件生成仿真数据的方法,能够根据不同的仿真数据应用场景生成分析所需的仿真数据记录。

    面向结构化仿真数据的质量评估方法、系统和设备

    公开(公告)号:CN114357714A

    公开(公告)日:2022-04-15

    申请号:CN202111474996.6

    申请日:2021-12-06

    Abstract: 本发明提供了一种面向结构化仿真数据的质量评估方法和系统,包括:根据原始数据构建仿真数据生成模型;数据拥有者使用包含隐私信息的原始数据对仿真数据生成模型进行训练,得到仿真数据;将原始数据和仿真数据输入评估系统,评估仿真数据的可用性和仿真数据的隐私性,选择质量最高的仿真数据发布;所述原始数据和仿真数据为结构化数据,由若干条数据记录组成,每条记录有若干字段,仿真数据的字段与原始数据的字段完全相同。本发明使用仿真数据代替原始数据参与数据流通进行质量评估,由于仿真数据的数据条目都是合成的,不与现实中的任何实体产生关联,也不需要其他的假设或先验知识,有效避免了隐私泄露的风险,评估全面、可靠,通用性好。

Patent Agency Ranking