-
公开(公告)号:CN116894271B
公开(公告)日:2024-04-26
申请号:CN202310980143.2
申请日:2023-08-04
Applicant: 中国医学科学院医学信息研究所
Abstract: 本发明公开了一种基于匿名化算法的数据共享隐私保护方法,涉及隐私保护技术领域,包括:识别和归并需要进行隐私保护的属性,明确匿名化处理对象;采用MSAK匿名算法第一次聚类将原始数据集划分为多个第一子数据集,分离每个第一子数据集的离群值,形成第二子数据集和第一待分配元组集合;第二次聚类对每个第二子数据集聚类,生成多个由相似元组构成的聚类簇,判断聚类簇的大小和过远元组剪裁,形成第一聚类簇集合、第二聚类簇集合和第二待分配元组集合;在所有聚类簇的基础上进行第三次聚类,将所有待分配元组分配到第一聚类簇集合、第二聚类簇集合中,用聚类中心取代聚类簇内所有元组,生成满足隐私保护模型的等价类,从而实现数据的匿名化。
-
公开(公告)号:CN116894271A
公开(公告)日:2023-10-17
申请号:CN202310980143.2
申请日:2023-08-04
Applicant: 中国医学科学院医学信息研究所
Abstract: 本发明公开了一种基于匿名化算法的数据共享隐私保护方法,涉及隐私保护技术领域,包括:识别和归并需要进行隐私保护的属性,明确匿名化处理对象;采用MSAK匿名算法第一次聚类将原始数据集划分为多个第一子数据集,分离每个第一子数据集的离群值,形成第二子数据集和第一待分配元组集合;第二次聚类对每个第二子数据集聚类,生成多个由相似元组构成的聚类簇,判断聚类簇的大小和过远元组剪裁,形成第一聚类簇集合、第二聚类簇集合和第二待分配元组集合;在所有聚类簇的基础上进行第三次聚类,将所有待分配元组分配到第一聚类簇集合、第二聚类簇集合中,用聚类中心取代聚类簇内所有元组,生成满足隐私保护模型的等价类,从而实现数据的匿名化。
-
公开(公告)号:CN118260802A
公开(公告)日:2024-06-28
申请号:CN202410472023.6
申请日:2023-08-04
Applicant: 中国医学科学院医学信息研究所
Abstract: 本发明公开了一种基于匿名化算法的结构化医学数据共享隐私保护方法,涉及隐私保护技术领域,包括:确定结构化医学数据集中需要进行匿名化的所有属性,采用MSAK匿名算法第一次聚类将原始数据集划分为多个第一子数据集,分离第一子数据集的离群值,形成第二子数据集和第一待分配元组集合;第二次聚类对每个第二子数据集聚类,生成多个由相似元组构成的聚类簇,判断聚类簇的大小和过远元组剪裁,形成第一聚类簇集合、第二聚类簇集合和第二待分配元组集合;在所有聚类簇的基础上进行第三次聚类,将所有待分配元组分配到第一聚类簇集合、第二聚类簇集合中,用聚类中心取代聚类簇内所有元组,生成满足隐私保护模型的等价类,实现数据的匿名化。
-
-