伪数据生成装置及其方法和程序

    公开(公告)号:CN111194448A

    公开(公告)日:2020-05-22

    申请号:CN201880065257.1

    申请日:2018-10-05

    Abstract: 伪数据生成装置包含:随机数生成部,生成各属性的频数分布的比例近似于伪对象数据的各属性的频数分布的比例的第一伪数据;以及数据整形部,使用将伪对象数据的方差协方差矩阵进行乔列斯基分解得到的矩阵或者将伪对象数据的方差协方差矩阵进行奇异值分解得到的扩大缩小矩阵,对第一伪数据进行整形,以使第一伪数据的平均矢量以及相关矩阵与伪对象数据的平均矢量以及相关矩阵一致,且第一伪数据的最小值以及最大值存在于伪对象数据的最小值以及最大值的范围内,并将整形后的第一伪数据设为伪数据。

    伪数据生成装置及其方法和记录介质

    公开(公告)号:CN111194448B

    公开(公告)日:2025-01-28

    申请号:CN201880065257.1

    申请日:2018-10-05

    Abstract: 伪数据生成装置包含:随机数生成部,生成各属性的频数分布的比例近似于伪对象数据的各属性的频数分布的比例的第一伪数据;以及数据整形部,使用将伪对象数据的方差协方差矩阵进行乔列斯基分解得到的矩阵或者将伪对象数据的方差协方差矩阵进行奇异值分解得到的扩大缩小矩阵,对第一伪数据进行整形,以使第一伪数据的平均矢量以及相关矩阵与伪对象数据的平均矢量以及相关矩阵一致,且第一伪数据的最小值以及最大值存在于伪对象数据的最小值以及最大值的范围内,并将整形后的第一伪数据设为伪数据。

    伪数据生成装置、其方法和程序

    公开(公告)号:CN111213146A

    公开(公告)日:2020-05-29

    申请号:CN201880066293.X

    申请日:2018-10-05

    Abstract: 一种伪数据生成装置,根据编码规则将原始数据中包含的类别属性的值编码为数值属性的值;使用用于数值属性的伪数据生成方法,根据编码后的原始数据生成第一伪数据;在第一伪数据中包含的、与类别属性的值对应的数值属性的值超过该数值属性的值可取的值的范围的情况下,将该数值属性的值转换为包含于该数值属性的值可取的值的范围的值;根据编码规则,将转换后的第一伪数据中包含的与类别属性的值对应的数值属性的值解码为类别属性的值,作为伪数据。

    匿名性评价装置、匿名性评价方法、记录介质

    公开(公告)号:CN113490938B

    公开(公告)日:2024-04-26

    申请号:CN202080016301.7

    申请日:2020-02-20

    Abstract: 提供对于将任意的表格进行了匿名化的表格,计算与匿名性有关的评价值的技术。包含:评价对象表格生成部,根据M×N的匿名化对象表格,生成包含作为相互不同的p个主属性的值的组的L个记录的p×L的第1评价对象表格,并根据将p个主属性作为对象而将匿名化对象表格进行了匿名化的M×N的匿名化完成表格,生成将p个主属性作为对象而将第1评价对象表格进行了匿名化的p×L的第2评价对象表格;以及评价值计算部,根据第1评价对象表格和第2评价对象表格,计算与成为评价对象的q个主属性有关的评价值,其中,将M设为属性的数量,将N设为记录的数量,将p设为主属性的数量,将L设为相互不同的p个主属性的值的组的数量。

    数据一般化装置、数据一般化方法、程序

    公开(公告)号:CN113544683B

    公开(公告)日:2023-09-29

    申请号:CN202080019664.6

    申请日:2020-02-20

    Inventor: 长谷川聪

    Abstract: 提供能够仅使用小容量的主存储装置,将大规模数据高速地进行一般化处理的数据一般化装置。将属性值进行一般化的数据一般化装置包括:排序部,按照辅助存储装置上的一般化层级中的属性值的排列顺序,对辅助存储装置上的属性值进行排序;属性值取得部,将排序后的属性值的一部分从辅助存储装置取得到主存储装置上;一般化层级取得部,将作为一般化层级的一部分、即与取得到主存储装置上的属性值中的处理对象的属性值对应的一般化层级从辅助存储装置取得到主存储装置上;一般化处理部,基于取得到主存储装置上的属性值和取得到主存储装置上的一般化层级,执行一般化处理;以及再排序部,将一般化处理后的属性值移动到辅助存储装置,排序为原来的顺序。

    数据置换装置、数据置换方法、程序

    公开(公告)号:CN113544684A

    公开(公告)日:2021-10-22

    申请号:CN202080019714.0

    申请日:2020-02-20

    Inventor: 长谷川聪

    Abstract: 提供只使用小容量的主存储装置便能够高速地微聚集大规模数据的数据置换装置。按每个组将属性值置换为代表值的数据置换装置包括:属性值集合取得部,在被分组的属性值集合的尺寸为预定的尺寸以下的情况下,在主存储装置上取得被分组的属性值集合,在被分组的属性值集合的尺寸比预定的尺寸大的情况下,在辅助存储装置上取得被分组的属性值集合;中值计算部,计算在主存储装置上或者辅助存储装置上被分组的属性值集合的中值;以及分割判定部,在基于中值将被分组的属性值集合二分割的情况下,当分割后的属性值集合各自的尺寸成为规定的阈值以上时,将分割后的两个属性值集合分别作为新的组。

    数据一般化装置、数据一般化方法、程序

    公开(公告)号:CN113544683A

    公开(公告)日:2021-10-22

    申请号:CN202080019664.6

    申请日:2020-02-20

    Inventor: 长谷川聪

    Abstract: 提供能够仅使用小容量的主存储装置,将大规模数据高速地进行一般化处理的数据一般化装置。将属性值进行一般化的数据一般化装置包括:排序部,按照辅助存储装置上的一般化层级中的属性值的排列顺序,对辅助存储装置上的属性值进行排序;属性值取得部,将排序后的属性值的一部分从辅助存储装置取得到主存储装置上;一般化层级取得部,将作为一般化层级的一部分、即与取得到主存储装置上的属性值中的处理对象的属性值对应的一般化层级从辅助存储装置取得到主存储装置上;一般化处理部,基于取得到主存储装置上的属性值和取得到主存储装置上的一般化层级,执行一般化处理;以及再排序部,将一般化处理后的属性值移动到辅助存储装置,排序为原来的顺序。

    伪数据生成装置、其方法和记录介质

    公开(公告)号:CN111213146B

    公开(公告)日:2024-05-03

    申请号:CN201880066293.X

    申请日:2018-10-05

    Abstract: 一种伪数据生成装置,根据编码规则将原始数据中包含的类别属性的值编码为数值属性的值;使用用于数值属性的伪数据生成方法,根据编码后的原始数据生成第一伪数据;在第一伪数据中包含的、与类别属性的值对应的数值属性的值超过该数值属性的值可取的值的范围的情况下,将该数值属性的值转换为包含于该数值属性的值可取的值的范围的值;根据编码规则,将转换后的第一伪数据中包含的与类别属性的值对应的数值属性的值解码为类别属性的值,作为伪数据。

    k-匿名化装置、方法以及记录介质

    公开(公告)号:CN111201532B

    公开(公告)日:2023-08-15

    申请号:CN201880065515.6

    申请日:2018-10-09

    Abstract: k‑匿名化装置包括:列表生成单元(1),根据对于数据库的各属性的各属性值的概括层级,生成将数据库的各属性的各属性值概括至概括层级的各概括级别后的值和表示该值的代码的列表;搜索单元(3),通过根据由通过参照生成的列表而得到的代码所表示的概括数据库,判定将数据库概括至与网格结构的各节点对应的概括级别为止的概括数据库是否具有k‑匿名性,从而并行地搜索具有k‑匿名性的网格结构的节点;以及输出单元(4),输出通过搜索发现的、将数据库概括至与具有k‑匿名性的网格结构的节点对应的概括级别为止的概括数据库。

Patent Agency Ranking