-
公开(公告)号:CN118170827B
公开(公告)日:2024-08-09
申请号:CN202410605468.7
申请日:2024-05-16
Applicant: 哈尔滨工业大学(威海)
IPC: G06F16/2458 , G06F16/22
Abstract: 本发明属于数据处理技术领域,具体涉及一种基于等价类结构的数据间函数依赖关系挖掘方法。该方法包括:步骤1,遍历每列数据,获得等价类结构;对原始数据集进行重构,主要分为去除属性、属性重排序和压缩取值;步骤2,对元组对进行伪随机采样,比较样本,生成非函数依赖,并在满足停止条件时停止,然后在FD‑tree结构上对非函数依赖进行归纳操作,得到候选函数依赖项;步骤3,对FD‑tree结构中的候选函数依赖项进行验证,将候选项进行分组,每个分组对应一个属性的等价类结构,按属性排序的倒序,使用相应等价类结构对分组中的候选项进行验证。本发明的方法能够高效快速地求得给定数据实例的函数依赖关系。
-
公开(公告)号:CN118170827A
公开(公告)日:2024-06-11
申请号:CN202410605468.7
申请日:2024-05-16
Applicant: 哈尔滨工业大学(威海)
IPC: G06F16/2458 , G06F16/22
Abstract: 本发明属于数据处理技术领域,具体涉及一种基于等价类结构的数据间函数依赖关系挖掘方法。该方法包括:步骤1,遍历每列数据,获得等价类结构;对原始数据集进行重构,主要分为去除属性、属性重排序和压缩取值;步骤2,对元组对进行伪随机采样,比较样本,生成非函数依赖,并在满足停止条件时停止,然后在FD‑tree结构上对非函数依赖进行归纳操作,得到候选函数依赖项;步骤3,对FD‑tree结构中的候选函数依赖项进行验证,将候选项进行分组,每个分组对应一个属性的等价类结构,按属性排序的倒序,使用相应等价类结构对分组中的候选项进行验证。本发明的方法能够高效快速地求得给定数据实例的函数依赖关系。
-