匿名化装置、匿名化方法、计算机可读取的记录介质

    公开(公告)号:CN113474778B

    公开(公告)日:2024-02-20

    申请号:CN202080016418.5

    申请日:2020-02-20

    Abstract: 提供不损害数据的有用性地进行匿名化的技术。包括:重复排除部,根据M×N的匿名化对象表格,生成包含p个主属性的值的组相互不同的、L个匿名化对象表格的记录的M×L的部分表格;匿名化部,根据部分表格,生成将p个主属性作为对象而对部分表格进行了匿名化的M×L的匿名化完成部分表格;以及重复还原部,根据所述匿名化对象表格和匿名化完成部分表格,生成将p个主属性为对象而对匿名化对象表格进行了匿名化的M×N的匿名化完成表格,其中,将M设为属性的数量,将N设为记录的数量,将p设为主属性的数量,将L设为相互不同的p个主属性的值的组的数量。

    匿名化装置、匿名化方法、程序

    公开(公告)号:CN113474778A

    公开(公告)日:2021-10-01

    申请号:CN202080016418.5

    申请日:2020-02-20

    Abstract: 提供不损害数据的有用性地进行匿名化的技术。包括:重复排除部,根据M×N的匿名化对象表格,生成包含p个主属性的值的组相互不同的、L个匿名化对象表格的记录的M×L的部分表格;匿名化部,根据部分表格,生成将p个主属性作为对象而对部分表格进行了匿名化的M×L的匿名化完成部分表格;以及重复还原部,根据所述匿名化对象表格和匿名化完成部分表格,生成将p个主属性为对象而对匿名化对象表格进行了匿名化的M×N的匿名化完成表格,其中,将M设为属性的数量,将N设为记录的数量,将p设为主属性的数量,将L设为相互不同的p个主属性的值的组的数量。

    伪数据生成装置及其方法和记录介质

    公开(公告)号:CN111194448B

    公开(公告)日:2025-01-28

    申请号:CN201880065257.1

    申请日:2018-10-05

    Abstract: 伪数据生成装置包含:随机数生成部,生成各属性的频数分布的比例近似于伪对象数据的各属性的频数分布的比例的第一伪数据;以及数据整形部,使用将伪对象数据的方差协方差矩阵进行乔列斯基分解得到的矩阵或者将伪对象数据的方差协方差矩阵进行奇异值分解得到的扩大缩小矩阵,对第一伪数据进行整形,以使第一伪数据的平均矢量以及相关矩阵与伪对象数据的平均矢量以及相关矩阵一致,且第一伪数据的最小值以及最大值存在于伪对象数据的最小值以及最大值的范围内,并将整形后的第一伪数据设为伪数据。

    伪数据生成装置、其方法和程序

    公开(公告)号:CN111213146A

    公开(公告)日:2020-05-29

    申请号:CN201880066293.X

    申请日:2018-10-05

    Abstract: 一种伪数据生成装置,根据编码规则将原始数据中包含的类别属性的值编码为数值属性的值;使用用于数值属性的伪数据生成方法,根据编码后的原始数据生成第一伪数据;在第一伪数据中包含的、与类别属性的值对应的数值属性的值超过该数值属性的值可取的值的范围的情况下,将该数值属性的值转换为包含于该数值属性的值可取的值的范围的值;根据编码规则,将转换后的第一伪数据中包含的与类别属性的值对应的数值属性的值解码为类别属性的值,作为伪数据。

    数据置换装置、数据置换方法、计算机程序产品

    公开(公告)号:CN113544684B

    公开(公告)日:2024-10-15

    申请号:CN202080019714.0

    申请日:2020-02-20

    Inventor: 长谷川聪

    Abstract: 提供只使用小容量的主存储装置便能够高速地微聚集大规模数据的数据置换装置。按每个组将属性值置换为代表值的数据置换装置包括:属性值集合取得部,在被分组的属性值集合的尺寸为预定的尺寸以下的情况下,在主存储装置上取得被分组的属性值集合,在被分组的属性值集合的尺寸比预定的尺寸大的情况下,在辅助存储装置上取得被分组的属性值集合;中值计算部,计算在主存储装置上或者辅助存储装置上被分组的属性值集合的中值;以及分割判定部,在基于中值将被分组的属性值集合二分割的情况下,当分割后的属性值集合各自的尺寸成为规定的阈值以上时,将分割后的两个属性值集合分别作为新的组。

    k-匿名化装置、方法以及程序

    公开(公告)号:CN111201532A

    公开(公告)日:2020-05-26

    申请号:CN201880065515.6

    申请日:2018-10-09

    Abstract: k-匿名化装置包括:列表生成单元(1),根据对于数据库的各属性的各属性值的概括层级,生成将数据库的各属性的各属性值概括至概括层级的各概括级别后的值和表示该值的代码的列表;搜索单元(3),通过根据由通过参照生成的列表而得到的代码所表示的概括数据库,判定将数据库概括至与网格结构的各节点对应的概括级别为止的概括数据库是否具有k-匿名性,从而并行地搜索具有k-匿名性的网格结构的节点;以及输出单元(4),输出通过搜索发现的、将数据库概括至与具有k-匿名性的网格结构的节点对应的概括级别为止的概括数据库。

    伪数据生成装置及其方法和程序

    公开(公告)号:CN111194448A

    公开(公告)日:2020-05-22

    申请号:CN201880065257.1

    申请日:2018-10-05

    Abstract: 伪数据生成装置包含:随机数生成部,生成各属性的频数分布的比例近似于伪对象数据的各属性的频数分布的比例的第一伪数据;以及数据整形部,使用将伪对象数据的方差协方差矩阵进行乔列斯基分解得到的矩阵或者将伪对象数据的方差协方差矩阵进行奇异值分解得到的扩大缩小矩阵,对第一伪数据进行整形,以使第一伪数据的平均矢量以及相关矩阵与伪对象数据的平均矢量以及相关矩阵一致,且第一伪数据的最小值以及最大值存在于伪对象数据的最小值以及最大值的范围内,并将整形后的第一伪数据设为伪数据。

Patent Agency Ranking