一种不均衡数据的异常识别与修复方法及系统

    公开(公告)号:CN117743938B

    公开(公告)日:2025-01-28

    申请号:CN202311785567.X

    申请日:2023-12-22

    Abstract: 本发明属于数据治理技术领域,具体涉及一种不均衡数据的异常识别与修复方法及系统。所述方法包括不均衡混合数据聚类分析、异常数据识别与特征定位、异常数据修复三部分内容,首先提出了基于代价优化的混合聚类算法,解决不均衡数据集下混合数据的有效聚类问题,实现同一聚类簇内数据具有高度相似性;其次提出一种基于孤立森林的异常特征定位算法,解决以往无监督异常检测算法仅能定位到异常记录而无法识别记录中具体异常特征的问题,实现问题数据的准确定位;最后提出基于异构变分自编码器的数据修复模型,实现对混合数据异常的可信修复,解决以往人工智能方法在数据修复过程中受数据分布和噪声数据干扰过大导致修复数据可信度不高的问题。

    一种电力量价费一致性核查规则挖掘方法与系统

    公开(公告)号:CN115809274A

    公开(公告)日:2023-03-17

    申请号:CN202211629856.6

    申请日:2022-12-19

    Abstract: 本发明属于电力系统技术领域,具体涉及一种电力量价费一致性核查规则挖掘方法与系统。所述方法包括:获取核查数据集,计算量价费数据的等价分划;使用深度优先空间搜索策略挖掘数据一致性关系,得到数据中的一致性关系集合;利用得到的一致性关系集合,对量价费一致性关系进行规则解析;通过规则解析,识别出在量价费数据中的罕见数据。本发明将一种新的针对分类型数据的一致性规则挖掘方法应用在电力量价费数据的核查工作中,能主动挖掘出数据中的潜在规则,良好地弥补了以往人工定义规则存在工作量大、耗时长、规则覆盖面不足、只能发现被定义规则覆盖的业务异常数据等短板,辅助业务人员更智能、更全面地完成电力营销量价费数据核查工作。

    一种深度学习驱动的异常识别与修复方法及智能化系统

    公开(公告)号:CN113240011A

    公开(公告)日:2021-08-10

    申请号:CN202110528781.1

    申请日:2021-05-14

    Abstract: 本发明涉及数据处理领域,具体涉及一种深度学习驱动的异常识别与修复方法及智能化系统。包括以下步骤:S1:数据结构识别,S2:数据特征变换,S3:训练异常检测和修复神经网络,S4:异常数据识别与异常修复,S5:数据特征还原。采用深度学习方法,对每个特征使用双分量混合模型,其中一个分量用于解释干净单元(即正常值),另一个分量用于解释异常单元(即异常值);通过降低异常单元的影响来模拟潜在的正常数据分布,为数据单元提供异常值分数和对单元修复的估计;将变分自编码器和生成对抗网络两个深度生成模型进行结合,有利于生成更好的修复结果;最终实现利用无监督学习方式对混合属性数据进行cell‑level(单元级别)的异常识别及修复。

    一种不均衡数据的异常识别与修复方法及系统

    公开(公告)号:CN117743938A

    公开(公告)日:2024-03-22

    申请号:CN202311785567.X

    申请日:2023-12-22

    Abstract: 本发明属于数据治理技术领域,具体涉及一种不均衡数据的异常识别与修复方法及系统。所述方法包括不均衡混合数据聚类分析、异常数据识别与特征定位、异常数据修复三部分内容,首先提出了基于代价优化的混合聚类算法,解决不均衡数据集下混合数据的有效聚类问题,实现同一聚类簇内数据具有高度相似性;其次提出一种基于孤立森林的异常特征定位算法,解决以往无监督异常检测算法仅能定位到异常记录而无法识别记录中具体异常特征的问题,实现问题数据的准确定位;最后提出基于异构变分自编码器的数据修复模型,实现对混合数据异常的可信修复,解决以往人工智能方法在数据修复过程中受数据分布和噪声数据干扰过大导致修复数据可信度不高的问题。

Patent Agency Ranking