-
公开(公告)号:CN116756494B
公开(公告)日:2024-01-23
申请号:CN202311057175.1
申请日:2023-08-22
Applicant: 之江实验室
IPC: G06F18/10 , G06F18/2433 , G06F18/27 , G06F17/18
Abstract: 本申请涉及一种数据异常值处理方法、装置、计算机设备和可读存储介质。所述方法包括:获取多个单样本数据中的目标列数据以及多个特征列数据;基于多个所述单样本数据的历史数据,确定每个所述单样本数据的异常值处理次数;根据所述目标列数据对多个所述特征列数据进行分类,得到多个特征列数据组;基于异常值处理次数为多个所述特征列数据组分配对应的数据组处理次数;基于所述数据组处理次数,对相应特征列数据组中的特征列数据进行异常数据处理。采用本方法能够实现数据的预处理,且为特征列数据组分配恰当的异常值处理次数,确保良好的数据清洗效果的同时尽可能的减少数据处理时间和资源的浪费,大幅度提高数据异常(56)对比文件D. G. Perez等“.Outlier DetectionApplying an Innovative User TransactionModeling with Automatic Explanation”.《2011 IEEE Electronics, Robotics andAutomotive Mechanics Conference》.2012,全文.
-
公开(公告)号:CN116756494A
公开(公告)日:2023-09-15
申请号:CN202311057175.1
申请日:2023-08-22
Applicant: 之江实验室
IPC: G06F18/10 , G06F18/2433 , G06F18/27 , G06F17/18
Abstract: 本申请涉及一种数据异常值处理方法、装置、计算机设备和可读存储介质。所述方法包括:获取多个单样本数据中的目标列数据以及多个特征列数据;基于多个所述单样本数据的历史数据,确定每个所述单样本数据的异常值处理次数;根据所述目标列数据对多个所述特征列数据进行分类,得到多个特征列数据组;基于异常值处理次数为多个所述特征列数据组分配对应的数据组处理次数;基于所述数据组处理次数,对相应特征列数据组中的特征列数据进行异常数据处理。采用本方法能够实现数据的预处理,且为特征列数据组分配恰当的异常值处理次数,确保良好的数据清洗效果的同时尽可能的减少数据处理时间和资源的浪费,大幅度提高数据异常值处理的效率和精度。
-
公开(公告)号:CN118279045A
公开(公告)日:2024-07-02
申请号:CN202410462598.X
申请日:2024-04-17
Applicant: 之江实验室
IPC: G06Q40/03 , G06Q10/0639 , G06Q10/0635 , G06F16/2458 , G06N3/126 , G06N3/006
Abstract: 本发明提供了一种基于遗传算法进行定向的企业数据生成方法及装置,该方法首先构建银行金融系统的企业标签体系,对标签进行汇总,得到标签库和打标系统;再构建企业数据异常检测模型,用于判断企业数据是否存在异常;根据业务需要,从标签库中选择若干标签,作为最终定向企业数据生成的分布依据;设计遗传算法的适应度函数,和交叉变异操作;系统的执行;得到定向生成的企业数据集合。解决了现有技术中企业数据模拟无法定向生成的问题。
-
-