一种基于预筛选动态集成的电力调度监控数据异常检测方法

    公开(公告)号:CN113112188B

    公开(公告)日:2022-05-17

    申请号:CN202110529491.9

    申请日:2021-05-14

    Abstract: 本发明实施例提出了一种基于预筛选动态集成的电力调度监控数据异常检测方法,包括:使用电力调度监控历史数据训练一定数量的基检测器;使用孤立森林方法对全部基检测器进行预筛选,筛选掉性能较差的基检测器;使用集成式KNN算法从历史数据中选择与待检测数据欧式距离较小的历史数据作为验证子集;使用最大值法根据筛选后剩余的基检测器在验证子集上的输出生成验证子集的假真值,计算基检测器在验证子集上的输出与假真值的皮尔逊相关系数;使用基于直方图的基检测器选择方法根据皮尔逊相关系数选择基检测器,平均所选基检测器的输出作为待检测数据的检测结果。本发明实施例提供的技术方案,能够提升电力调度监控数据异常检测的准确率。

    一种基于动静态选择集成的电力调度监控数据异常检测方法

    公开(公告)号:CN114399407A

    公开(公告)日:2022-04-26

    申请号:CN202210147086.5

    申请日:2022-02-17

    Abstract: 本发明实施例提出了一种基于动静态选择集成的电力调度监控数据异常检测方法,包括:使用电力调度监控历史数据训练一定数量的基检测器;使用孤立森林剔除性能较差的基检测器;使用平均值法根据剩余基检测器的输出生成历史数据的假真值,并分别将假真值和基检测器的输出转换为二类标签;剔除假真值过小的历史数据,并提取基检测器在剩余历史数据上的元特征和元标签;通过元特征和元标签训练随机森林;提取基检测器在待检测数据上的元特征,将其输入随机森林,根据随机森林的输出选择基检测器,取所选基检测器的输出的最大值作为待检测数据的检测结果。本发明实施例提供的技术方案,能够提升电力调度监控数据异常检测的准确率。

    一种基于对数区间隔离的电力调度数据异常检测方法

    公开(公告)号:CN112181706B

    公开(公告)日:2023-09-22

    申请号:CN202011148000.8

    申请日:2020-10-23

    Abstract: 本发明实施例提出了一种基于对数区间隔离的电力调度数据异常检测方法,包括:通过Bagging技术生成大量训练数据集的子集;计算每个子集空间下每个子样本对于该空间的马氏距离,根据样本马氏距离对子集空间中每个样本进行对数区间隔离;根据区间内样本的数据分布对样本进行二叉划分,在左右子树节点的子集上重复上面的过程,直至达到终止条件;构建多个对数区间隔离子树,并将其组成对数区间隔离森林异常检测器,求出每个样本在每个子树下的路径长度,集成每个子树中对应数据的路径并取平均值求得异常分数,根据异常率阈值筛选出数据集中的异常样本;通过构建的对数区间隔离森林异常检测器判断电力数据的异常情况,提高数据异常检测准确率。

    一种基于对数区间隔离的电力调度数据异常检测方法

    公开(公告)号:CN112181706A

    公开(公告)日:2021-01-05

    申请号:CN202011148000.8

    申请日:2020-10-23

    Abstract: 本发明实施例提出了一种基于对数区间隔离的电力调度数据异常检测方法,包括:通过Bagging技术生成大量训练数据集的子集;计算每个子集空间下每个子样本对于该空间的马氏距离,根据样本马氏距离对子集空间中每个样本进行对数区间隔离;根据区间内样本的数据分布对样本进行二叉划分,在左右子树节点的子集上重复上面的过程,直至达到终止条件;构建多个对数区间隔离子树,并将其组成对数区间隔离森林异常检测器,求出每个样本在每个子树下的路径长度,集成每个子树中对应数据的路径并取平均值求得异常分数,根据异常率阈值筛选出数据集中的异常样本;通过构建的对数区间隔离森林异常检测器判断电力数据的异常情况,提高数据异常检测准确率。

    一种基于动静态选择集成的电力调度监控数据异常检测方法

    公开(公告)号:CN114399407B

    公开(公告)日:2024-08-27

    申请号:CN202210147086.5

    申请日:2022-02-17

    Abstract: 本发明实施例提出了一种基于动静态选择集成的电力调度监控数据异常检测方法,包括:使用电力调度监控历史数据训练一定数量的基检测器;使用孤立森林剔除性能较差的基检测器;使用平均值法根据剩余基检测器的输出生成历史数据的假真值,并分别将假真值和基检测器的输出转换为二类标签;剔除假真值过小的历史数据,并提取基检测器在剩余历史数据上的元特征和元标签;通过元特征和元标签训练随机森林;提取基检测器在待检测数据上的元特征,将其输入随机森林,根据随机森林的输出选择基检测器,取所选基检测器的输出的最大值作为待检测数据的检测结果。本发明实施例提供的技术方案,能够提升电力调度监控数据异常检测的准确率。

    一种基于密度距离综合决策的电力调度监控数据异常检测方法

    公开(公告)号:CN113608968A

    公开(公告)日:2021-11-05

    申请号:CN202110967252.1

    申请日:2021-08-23

    Abstract: 本发明实施例提出了一种基于密度距离综合决策的电力调度监控数据异常检测方法,包括:将电力调度监控历史数据作为输入数据集,通过局部可达距离与核密度估计来计算样本的局部密度;使用自然对数函数作为缩放函数,计算每个样本与其近邻的密度比;通过欧式距离找到每个样本密度比自身大的近邻,计算密度提升距离;将局部密度比与密度提升距离标准化后计算乘积,得到最终的异常分数,并判定数据中的异常样本。本发明实施例提供的技术方案,能够提升电力调度监控数据异常检测的准确率。

    一种基于预筛选动态集成的电力调度监控数据异常检测方法

    公开(公告)号:CN113112188A

    公开(公告)日:2021-07-13

    申请号:CN202110529491.9

    申请日:2021-05-14

    Abstract: 本发明实施例提出了一种基于预筛选动态集成的电力调度监控数据异常检测方法,包括:使用电力调度监控历史数据训练一定数量的基检测器;使用孤立森林方法对全部基检测器进行预筛选,筛选掉性能较差的基检测器;使用集成式KNN算法从历史数据中选择与待检测数据欧式距离较小的历史数据作为验证子集;使用最大值法根据筛选后剩余的基检测器在验证子集上的输出生成验证子集的假真值,计算基检测器在验证子集上的输出与假真值的皮尔逊相关系数;使用基于直方图的基检测器选择方法根据皮尔逊相关系数选择基检测器,平均所选基检测器的输出作为待检测数据的检测结果。本发明实施例提供的技术方案,能够提升电力调度监控数据异常检测的准确率。

    一种基于不平衡集成二分类的磁盘故障预测方法

    公开(公告)号:CN112465153A

    公开(公告)日:2021-03-09

    申请号:CN202011510541.0

    申请日:2020-12-18

    Abstract: 本发明公开了一种基于不平衡集成二分类的磁盘故障预测方法,包括:对磁盘的SMART数据进行采样,选取与磁盘故障相关的状态特征作为原始数据集,通过数据分区混合采样获得平衡数据集;将磁盘原始数据集和平衡数据集输入RF算法进行机器学习,分别训练出偏向多数类的原始模型和局部域加强和削弱模型,集成两种模型获得偏向外围边界的混合模型;根据放入原始磁盘数据集近邻的不平衡程度,自适应地选择三种模型,所获分类概率用来预测磁盘故障状态。本发明可以有效解决正、异常样本数量不均衡下磁盘故障预测难度大的问题,提高基于机器学习的磁盘故障预测能力。

    一种基于邻域分区与隔离重构的磁盘异常检测方法

    公开(公告)号:CN112562771B

    公开(公告)日:2022-07-26

    申请号:CN202011564817.3

    申请日:2020-12-25

    Abstract: 本发明实施例提出了一种基于邻域分区与隔离重构的磁盘异常检测方法,包括:收集磁盘SMART信息并筛选出有效的磁盘特征属性组成数据集,对其进行指数平滑处理得到磁盘训练集;多次随机采样训练集获得多个子训练集,在子集中以各点距其最近点的距离为半径构建磁盘特征隔离区域,将不属于任何区域的测试点作为全局异常;对于非全局异常的测试点,将其连续两个近邻点所在区域半径比作为该测试点在此区域的前异常值;包含测试点后重新构建区域,将测试点所处区域重构前后的半径比作为该测试点在此区域的后异常值;结合测试点所处所有区域的前后异常值得到异常分数,本发明实施例提供的技术方案,能有效提高异常磁盘召回率。

Patent Agency Ranking