-
公开(公告)号:CN116304941A
公开(公告)日:2023-06-23
申请号:CN202310226282.6
申请日:2023-03-09
Applicant: 上海海洋大学
IPC: G06F18/2433 , G06F18/214 , G06F18/21 , G06N20/20
Abstract: 本发明提供一种基于多模型组合的海洋数据质量控制方法及装置,所述方法包括:构建数据集,并对数据集中的数据进行处理,将数据集训练数据集和测试数据集;对多种类型的基分类器进行实验和选择,将分类结果进行对比分析并选取效果好的基分类模型;采用自学习下采样的数据采样方法对基分类模型进行训练,并使用基分类模型对数据质量进行初步控制,得到一级标识结果;采用Stacking算法构建融合决策,构建多模型组合的海洋数据质量控制模型,得到最终的数据质量控制结果;利用训练数据集训练所述多模型组合的质控模型,利用测试数据集对训练好的质控模型进行测试。本发明可提高异常数据的检测能力。