-
公开(公告)号:CN104732154B
公开(公告)日:2018-01-12
申请号:CN201410680565.9
申请日:2014-11-24
Applicant: 国际商业机器公司
Inventor: A·格考拉拉斯-迪瓦尼斯 , G·A·索特尔
CPC classification number: G06F21/6227 , G06F21/6254
Abstract: 本公开提供了将数据匿名化的方法和系统。所述方法包括:接收包括数据集的输入,所述数据集具有关系数据部分和序列数据部分两者;从数据集中识别与实体相对应的直接标识符属性;屏蔽或抑制所识别的直接标识符属性值;基于关于定义的成本函数F的相似性对记录排序;选择并迭代地将使用成本函数F而排序的至少前k个记录的每个组匿名化,至少k个记录的每个组构成一个群,将属性值匿名化是沿着关系部分和序列部分两者进行的,其中k是指定的k‑匿名化参数;以及重复选择并迭代地将连续的群中的至少k个记录的每个连续组匿名化的步骤,将属性值匿名化是沿着所述组中的记录的关系部分和序列部分两者进行的,其中匿名化的表格表示是由匿名化产生的。
-
公开(公告)号:CN104732154A
公开(公告)日:2015-06-24
申请号:CN201410680565.9
申请日:2014-11-24
Applicant: 国际商业机器公司
Inventor: A·格考拉拉斯-迪瓦尼斯 , G·A·索特尔
CPC classification number: G06F21/6227 , G06F21/6254
Abstract: 本公开提供了将数据匿名化的方法和系统。所述方法包括:接收包括数据集的输入,所述数据集具有关系数据部分和序列数据部分两者;从数据集中识别与实体相对应的直接标识符属性;屏蔽或抑制所识别的直接标识符属性值;基于关于定义的成本函数F的相似性对记录排序;选择并迭代地将使用成本函数F而排序的至少前k个记录的每个组匿名化,至少k个记录的每个组构成一个群,将属性值匿名化是沿着关系部分和序列部分两者进行的,其中k是指定的k-匿名化参数;以及重复选择并迭代地将连续的群中的至少k个记录的每个连续组匿名化的步骤,将属性值匿名化是沿着所述组中的记录的关系部分和序列部分两者进行的,其中匿名化的表格表示是由匿名化产生的。
-