-
公开(公告)号:CN117708111A
公开(公告)日:2024-03-15
申请号:CN202311742033.9
申请日:2023-12-18
Applicant: 哈尔滨工业大学
IPC: G06F16/215 , G06F16/2455 , G06F16/901
Abstract: 一种基于否定约束的错误数据检测方法及系统,涉及计算机数据清洗技术领域,针对现有技术中利用否定约束进行错误数据检测存在效率低的问题,本申请利用矩阵的思维保存证据集,用0和1表示是否满足谓词,减少了使用字符串时的重复匹配操作与冗余路径的搜索,在不降低错误数据检测精度的情况下大幅提高了错误数据检测的速度,同时没有降低对错误数据的检测精度。
-
公开(公告)号:CN116451023A
公开(公告)日:2023-07-18
申请号:CN202310386774.1
申请日:2023-04-12
Applicant: 哈尔滨工业大学
IPC: G06F18/10 , G06F18/15 , G06F18/2415
Abstract: 多规则协同的数据清洗系统、存储介质及设备,涉及计算机数据处理领域。本发明是为了解决现有的数据清洗方法还存在由于逻辑冲突频发和错误率高而导致的难以实现自动数据清洗的问题。本发明包括:规则存储单元:存储修复规则;规则修改单元:修改修复规则;规则冲突检测单元:检测正在计算顺序的规则是否发生冲突;规则修复单元:修复冲突的规则;规则顺序计算单元:计算规则顺序;错误数据检测单元:判断数据错误的原因并推荐修复方式;错误数据修复单元:按照推荐的修复方式和规则顺序对错误数据进行修复;约束修改单元:采用推荐的修复方式修复数据,并将修复方式发送给规则库模块。本发明用于数据清洗。
-