-
公开(公告)号:CN117076976A
公开(公告)日:2023-11-17
申请号:CN202310928618.3
申请日:2023-07-27
Applicant: 北京工业大学
Abstract: 本发明公开了一种面向数据不平衡分布的融合集成空气质量异常检测方法,该方法用于实现面向数据不平衡分布的空气质量异常检测。首先,该方法结合空气质量检测站点采集到的空气质量监测数据、空气质量异常投诉语料数据提取空气质量异常数据,建立空气质量异常检测数据集;其次,采用一种随机森林特征选择方法(ParcelForestModel)构造空气质量异常检测数据集特征向量;第三,提出了一种基于分层抽样的数据再平衡方法;最后,基于随机森林的贝叶斯超参数优化算法构建融合集成的HPO‑LGBM模型,实现空气质量异常检测。本发明构建HPO‑LGBM模型,克服了限制因素,并为面向数据不平衡分布的空气质量异常检测提供了一种开放式的研究框架。
-
公开(公告)号:CN117332344A
公开(公告)日:2024-01-02
申请号:CN202311051456.6
申请日:2023-08-21
Applicant: 北京工业大学
IPC: G06F18/2433 , G01N33/00 , G06F18/2321 , G06F18/15 , G06N3/088 , G06N3/0455 , G06N3/084
Abstract: 本发明公开了一种基于误差优化自动编码器模型的空气质量异常检测方法,该方法第一阶段首先进行误差优化训练,获得空气质量异常检测数据集的无监督聚类;其次,使用不同策略从空气质量异常检测数据集的无监督聚类中挑选可能的离群值实例,并构建空气质量正常数据集;最后,在空气质量正常数据集上应用深度自动编码器模型以优化其重建误差。第二阶段,本发明构建一种基于EOA模型的空气质量异常检测方法,使用空气质量异常检测数据集对该模型进行训练和验证。本发明提出的误差优化自动编码器模型可优化深度自动编码器模型,在计算重建误差时只使用空气质量正常数据集,提升空气质量异常检测效果。
-