基于异常值检测的自适应集成学习模型及构建方法与应用

    公开(公告)号:CN118446340A

    公开(公告)日:2024-08-06

    申请号:CN202410553103.4

    申请日:2024-05-07

    Abstract: 本发明属于集成学习技术领域,公开了一种基于异常值检测的自适应集成学习模型及构建方法与应用,其构建方法包括如下步骤:S1.构建包括多个弱分类器的自适应集成学习模型以及用于异常值检测的基学习器;S2.利用所述基学习器进行训练数据集的异常值检测,并获取所述训练数据集中异常值与正常值的相应权重;S3.利用所述基学习器所获取的相应权重更新所述自适应集成学习模型中弱分类器的基础权重,并利用所述训练数据集训练更新后的自适应集成学习模型。综上,本发明具体通过在集成学习的基学习器中引入异常值检测机制,从而在不对数据集进行直接处理的前提下完成异常值处理,满足不同训练需求、并减少异常值对模型的不良影响。

    一种融合集成学习与知识蒸馏的模型建立方法

    公开(公告)号:CN118035747A

    公开(公告)日:2024-05-14

    申请号:CN202410245795.6

    申请日:2024-03-04

    Abstract: 本发明属于机器学习技术领域,且公开了一种融合集成学习与知识蒸馏的模型建立方法,包括以下步骤:使用差异数据集提取特征向量,通过DBSCAN算法聚类,对每个类别训练基学习器并选出最佳者用于后续集成,利用已训练的基学习器构建集成模型,预测并生成软标签。初始化并训练小型学生模型,采用交叉熵和KL散度损失,调整温度参数以平衡软标签的平滑度和信息保留,最后将学生模型部署到目标设备上,本发明通过对集成学习模型的知识蒸馏,可以将最后部署模型的复杂度降低,减少部署模型对部署环境的要求,提升模型的可解释性,通过对集成学习模型的蒸馏促使模型认识样本的模糊性,从而降低过拟合的风险。

    一种基于特征工程改进的集成学习模型建立方法

    公开(公告)号:CN117290731A

    公开(公告)日:2023-12-26

    申请号:CN202311342076.8

    申请日:2023-10-16

    Abstract: 本发明属于学习模型建立方法技术领域,且公开了一种基于特征工程改进的集成学习模型建立方法,包括如下步骤:S1:对原始数据集D进行特征选择与降维;S2:对处理后的数据集进行划分;S3:对划分后的数据集进行弱分类器的训练,生成集成学习模型;S4:对于最终得到模型的性能指标以及可解释性进行进一步的验证实验。本发明通过选择和构造最有代表性的特征,特征工程可以增强集成学习基模型的预测能力,并且通过减少不必要的特征或降低特征维度,可以加速基模型的训练速度,从而加速整体的集成学习过程,另外特征选择和正则化可以减少模型的复杂性,从而降低过拟合的风险,通过特征选择和降维,降低计算和存储的需求。

    一种基于TFT-DANN模型的大气污染物浓度预测方法

    公开(公告)号:CN118571345A

    公开(公告)日:2024-08-30

    申请号:CN202410383679.0

    申请日:2024-04-01

    Abstract: 本发明属于大数据分析技术领域,公开了一种基于TFT‑DANN模型的大气污染物浓度预测方法,包括如下步骤:S1.通过N个源域站点的气象数据和污染物浓度数据创建模型训练数据;S2.构建多源TFT‑DANN预测模型,并利用所述模型训练数据训练所述多源TFT‑DANN预测模型;S3.将训练好的所述多源TFT‑DANN预测模型应用于目标域站点的实时污染物浓度预测中。在步骤S3中:提取N个源域站点与目标域站点之间的域不变性特征;基于源域站点与目标域站点的相似性分别对N个域不变性特征进行加权集成处理;将加权集成处理后的特征应用于训练好的所述多源TFT‑DANN预测模型。综上,本发明能够通过训练多个TFT‑DANN神经网络来提取N个源域和目标域站点之间的域不变性特征,从而提高对目标任务的预测性能。

    一种基于国密SM9算法的零信任SPA业务访问方法

    公开(公告)号:CN118487776A

    公开(公告)日:2024-08-13

    申请号:CN202410719378.0

    申请日:2024-06-04

    Abstract: 本发明属于信息安全技术领域,且公开了一种基于国密SM9算法的零信任SPA业务访问方法,包括如下步骤:一、SDP控制器服务上线,二、SDP客户端向SDP控制器注册,SDP控制器为SDP客户端生成I D和一次性口令种子,三、SDP客户端加密生成单包认证信息发送至SDP控制器,四、SDP控制器收到单包认证信息进行解密,为身份认证成功的客户端分发身份令牌,五、SDP客户端向每个可接受连接的SDP网关发起单包授权,并创建与SDP网关的TLS双向加密连接,六、SDP客户端的业务访问请求到达SDP网关后,对有权限访问的客户端予以放行,通过使用国密SM9标识密码算法,改进SPA数据包的加密方式,减少了网络攻击面。

    一种基于可解释性的条件表格GAN建立方法

    公开(公告)号:CN119808845A

    公开(公告)日:2025-04-11

    申请号:CN202411855650.4

    申请日:2024-12-16

    Abstract: 本发明属于数据生成技术领域,公开了一种基于可解释性的条件表格GAN建立方法,包括:构建预训练模型;通过可解释性模型计算原始数据集中各样本的特征,并集合形成特征数据集;利用所述特征数据集训练所述预训练模型;构建基础GAN框架,并将训练后的所述预训练模型嵌入所述基础GAN框架,获得条件表格GAN;利用原始数据集训练所述条件表格GAN。综上,本发明通过使用可解释性模型、机器学习算法和基础GAN框架,使得本发明条件表格GAN可以更好的控制生成样本类别、并提高生成样本的多样性,进而提高最终表格数据的生成质量与生成效率。

    一种基于恒压供水的SMOTE-ENN-GWO-SVM模型的低成本直饮水管道漏损检测方法

    公开(公告)号:CN119289298A

    公开(公告)日:2025-01-10

    申请号:CN202411448777.4

    申请日:2024-10-17

    Abstract: 本发明提出了一种基于恒压供水的SMOTE‑ENN‑GWO‑SVM模型的低成本直饮水管道漏损检测方法。本发明通过下述技术方案予以实现,包括下述步骤:1.采集供水变频器的运行数据,并根据历史工况对数据进行标注,即漏损或正常。2.由于1中采集的数据集进行存在不平衡,故采用SMOTE‑ENN算法对不平衡数据进行处理。3.使用GWO算法对SVM的超参数,即惩罚因子C和核函数参数g,进行迭代寻优。4.通过3中得到最优超参数构建的SVM模型。5.使用4中的模型进行管道检测。在恒压供水下,当智能检测设备不足,无法获取详细管道数据时,可使用本发明对管道进行检测。

Patent Agency Ranking