-
公开(公告)号:CN110457940A
公开(公告)日:2019-11-15
申请号:CN201910621081.X
申请日:2019-07-10
Applicant: 贵州大学
IPC: G06F21/62
Abstract: 本发明公开了一种一种基于图论和互信息量的差分隐私度量方法。本发明以信息论通信模型重构了差分隐私保护框架,构造了差分隐私的信息通信模型,将原始数据集表示为信源,发布数据集表示为信宿,查询机制和噪音机制表示为通信信道;所提出的差分隐私度量模型以信息通信模型为基础,利用图的特性结合信息熵给出隐私泄露量的互信息化计算方法,隐私泄露量的界仅依赖于原始数据集的属性数量、属性值数量及差分隐私预算参数,对任意分布的原始数据集,任意攻击能力的敌手都成立。本发明提出的差分隐度量方法可给出差分隐私保护的隐私泄露互信息上界,限制条件较少,适用于所有信道,且不依赖原始数据集的分布。
-
公开(公告)号:CN110457940B
公开(公告)日:2023-04-11
申请号:CN201910621081.X
申请日:2019-07-10
Applicant: 贵州大学
IPC: G06F21/62
Abstract: 本发明公开了一种一种基于图论和互信息量的差分隐私度量方法。本发明以信息论通信模型重构了差分隐私保护框架,构造了差分隐私的信息通信模型,将原始数据集表示为信源,发布数据集表示为信宿,查询机制和噪音机制表示为通信信道;所提出的差分隐私度量模型以信息通信模型为基础,利用图的特性结合信息熵给出隐私泄露量的互信息化计算方法,隐私泄露量的界仅依赖于原始数据集的属性数量、属性值数量及差分隐私预算参数,对任意分布的原始数据集,任意攻击能力的敌手都成立。本发明提出的差分隐度量方法可给出差分隐私保护的隐私泄露互信息上界,限制条件较少,适用于所有信道,且不依赖原始数据集的分布。
-
公开(公告)号:CN110377605A
公开(公告)日:2019-10-25
申请号:CN201910669519.1
申请日:2019-07-24
Applicant: 贵州大学
IPC: G06F16/22 , G06F16/28 , G06F16/2458
Abstract: 本发明公开了一种一种结构化数据的敏感属性识别与分类分级方法。本发明将结构化数据表中的敏感属性实现自动化识别及精确地分类分级处理,以便后续将敏感属性的分类分级结果输出采取适当的隐私保护处理后进行数据发布。聚类分析是机器学习中的一种无监督学习方式,不需要预知样本集的分类情况就可以根据属性间相似度自动实现数据属性的分类。在敏感属性的最终识别阶段,考虑了敏感属性与疑似敏感属性之间的关联关系,目的是为了解决链接攻击的问题,从而进一步挖掘与敏感属性有关联的属性,减少隐私的泄露程度。在敏感属性的分类分级阶段,既考虑了敏感属性间的互信息相关性,也分析了属性间的关联关系,两者结合从而对敏感属性更加精准地分类。
-
公开(公告)号:CN110134719A
公开(公告)日:2019-08-16
申请号:CN201910412420.3
申请日:2019-05-17
Applicant: 贵州大学
IPC: G06F16/2458 , G06F16/28
Abstract: 本发明公开了结构化数据敏感属性的识别与分类分级方法,该方法包括步骤,首先根据用户需求输入待处理的结构化数据表;然后利用信息熵及最大熵计算属性的隐私敏感度;利用k-means聚类算法对属性的敏感度进行聚类,将属性初始划分为敏感属性集和疑似敏感属性集两个簇;进一步利用Apriori算法挖掘疑似敏感属性集与敏感属性集间关联关系,将任意结构化数据的敏感属性进最终识别为敏感属性集与非敏感属性集;最后,仅仅针对敏感属性集来操作,通过对敏感属性集中属性间的互信息相关性和关联规则分析,对敏感属性进行分类,并对各敏感属性组的平均敏感度量化,实现敏感属性的分类分级。该方法面向隐私保护能同时达到敏感属性的识别与分级效果,不需要预知结构化数据集的属性特征、敏感特征字典,兼顾了属性间的相关性和关联关系。
-
公开(公告)号:CN110134719B
公开(公告)日:2023-04-28
申请号:CN201910412420.3
申请日:2019-05-17
Applicant: 贵州大学
IPC: G06F16/2458 , G06F16/28
Abstract: 本发明公开了结构化数据敏感属性的识别与分类分级方法,该方法包括步骤,首先根据用户需求输入待处理的结构化数据表;然后利用信息熵及最大熵计算属性的隐私敏感度;利用k‑means聚类算法对属性的敏感度进行聚类,将属性初始划分为敏感属性集和疑似敏感属性集两个簇;进一步利用Apriori算法挖掘疑似敏感属性集与敏感属性集间关联关系,将任意结构化数据的敏感属性进最终识别为敏感属性集与非敏感属性集;最后,仅仅针对敏感属性集来操作,通过对敏感属性集中属性间的互信息相关性和关联规则分析,对敏感属性进行分类,并对各敏感属性组的平均敏感度量化,实现敏感属性的分类分级。该方法面向隐私保护能同时达到敏感属性的识别与分级效果,不需要预知结构化数据集的属性特征、敏感特征字典,兼顾了属性间的相关性和关联关系。
-
公开(公告)号:CN110377605B
公开(公告)日:2023-04-25
申请号:CN201910669519.1
申请日:2019-07-24
Applicant: 贵州大学
IPC: G06F16/22 , G06F16/28 , G06F16/2458
Abstract: 本发明公开了一种一种结构化数据的敏感属性识别与分类分级方法。本发明将结构化数据表中的敏感属性实现自动化识别及精确地分类分级处理,以便后续将敏感属性的分类分级结果输出采取适当的隐私保护处理后进行数据发布。聚类分析是机器学习中的一种无监督学习方式,不需要预知样本集的分类情况就可以根据属性间相似度自动实现数据属性的分类。在敏感属性的最终识别阶段,考虑了敏感属性与疑似敏感属性之间的关联关系,目的是为了解决链接攻击的问题,从而进一步挖掘与敏感属性有关联的属性,减少隐私的泄露程度。在敏感属性的分类分级阶段,既考虑了敏感属性间的互信息相关性,也分析了属性间的关联关系,两者结合从而对敏感属性更加精准地分类。
-
-
-
-
-