-
公开(公告)号:CN108446294A
公开(公告)日:2018-08-24
申请号:CN201810059024.2
申请日:2018-01-22
Applicant: 东华大学
Abstract: 本发明涉及一种面向脏数据的清洗规则挖掘系统,包括规则挖掘模块和策略推荐模块,所述规则挖掘模块采用改进的TANE算法从脏数据中挖掘近似函数依赖;所述策略推荐模块对挖掘出来的近似函数依赖采用基于支持度的排序策略和综合得分排序策略进行排序,用户验证候选近似函数依赖是否为有效的清洗规则。如果是,则利用该清洗规则来检测和修复脏数据。本发明能够帮助用户发现有用的函数依赖,同时检测并修改错误。