-
公开(公告)号:CN119622822A
公开(公告)日:2025-03-14
申请号:CN202510161837.2
申请日:2025-02-14
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
Abstract: 本发明提供了一种隐私增强的关系型表格数据仿真生成方法,挖掘链接表L与具有外键关联的单表U、V中高度相关的属性,并将属性与链接表L进行合并,得到k个属性对相应的U、V表中的属性;根据链接表L的外键对应关系,将得到的属性与链接表L进行拼接,得到合并表#imgabs0#,根据链接表L的属性,将合并表#imgabs1#按列切分,得到仿真生成的链接表#imgabs2#;根据链接表#imgabs3#的合成结果,使用马尔科夫随机场模型仿真生成表#imgabs4#;根据链接表#imgabs5#的合成结果,使用马尔科夫随机场模型仿真生成表#imgabs6#。在仿真数据生成时提高仿真数据的效用,确保仿真数据在保护隐私的同时仍能保持其真实性和有效性。
-
公开(公告)号:CN117313160B
公开(公告)日:2024-04-09
申请号:CN202311553385.X
申请日:2023-11-21
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
Abstract: 本发明提供了一种隐私增强的结构化数据仿真生成方法及系统,该方法包括:步骤一,数据转换阶段:对数据进行规范化预处理;步骤二,概率图模型构建阶段:基于贝叶斯形式对所述步骤一进行规范化预处理的数据构建变分推断的后验分布,利用斯坦因变分梯度下降方法得到描述结构化数据特征间的关联关系,在引入差分隐私噪声时,采用蒙特卡洛估计算法自动获得每步更新所需添加的噪声量;步骤三,数据生成阶段:将所述步骤二得到的关联关系作为度量集合,生成与真实数据更加精确的仿真数据。本发明的有益效果是:本发明方法避免了在应用DP‑SGD时对梯度进行剪裁,不仅避免了剪裁参数的选择,而且缓解了梯度剪裁对推断过程的不利影响。
-
公开(公告)号:CN117313160A
公开(公告)日:2023-12-29
申请号:CN202311553385.X
申请日:2023-11-21
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
Abstract: 本发明提供了一种隐私增强的结构化数据仿真生成方法及系统,该方法包括:步骤一,数据转换阶段:对数据进行规范化预处理;步骤二,概率图模型构建阶段:基于贝叶斯形式对所述步骤一进行规范化预处理的数据构建变分推断的后验分布,利用斯坦因变分梯度下降方法得到描述结构化数据特征间的关联关系,在引入差分隐私噪声时,采用蒙特卡洛估计算法自动获得每步更新所需添加的噪声量;步骤三,数据生成阶段:将所述步骤二得到的关联关系作为度量集合,生成与真实数据更加精确的仿真数据。本发明的有益效果是:本发明方法避免了在应用DP‑SGD时对梯度进行剪裁,不仅避免了剪裁参数的选择,而且缓解了梯度剪裁对推断过程的不利影响。
-
-