-
公开(公告)号:CN114300116A
公开(公告)日:2022-04-08
申请号:CN202111327568.0
申请日:2021-11-10
Applicant: 安徽大学
Abstract: 一种基于在线分类算法的鲁棒性病症检测方法。所述方法包括;S1、通过在线分类方法处理病症数据集,得到病症检测集成分类器;S2、通过在线分类算法更新病症检测集成分类器中的历史数据,删除噪声点;S3、通过病症检测集成分类器对目标病症数据集进行病症检测。本发明通过在步骤S1中划分聚类空间对样本做出区分,然后在步骤S2中进一步筛选数据样本,对样本进行更新、淘汰,提升分类预测的质量,处理噪声点带来的负面影响,加强数据集的稳定性;在样本以数据流的形式到达时,样本空间不断做出更新,大大提升了优秀样本的利用率,通过样本在不同簇的选取情况,确定每个簇的活跃程度,判断病症样本的变化区间,提升分类的精度。
-
公开(公告)号:CN114300116B
公开(公告)日:2023-11-28
申请号:CN202111327568.0
申请日:2021-11-10
Applicant: 安徽大学
IPC: G16H50/20 , G06F18/23 , G06F18/2413 , G06F18/214
Abstract: 一种基于在线分类算法的鲁棒性病症检测方法。所述方法包括;S1、通过在线分类方法处理病症数据集,得到病症检测集成分类器;S2、通过在线分类算法更新病症检测集成分类器中的历史数据,删除噪声点;S3、通过病症检测集成分类器对目标病症数据集进行病症检测。本发明通过在步骤S1中划分聚类空间对样本做出区分,然后在步骤S2中进一步筛选数据样本,对样本进行更新、淘汰,提升分类预测的质量,处理噪声点带来的负面影响,加强数据集的稳定性;在样本以数据流的形式到达时,样本空间不断做出更新,大大提升了优秀样本的利用率,通过样本在不同簇的选取情况,确定每个簇的活跃程度,判断病症样本的变化区间,提升分类的精度。(56)对比文件林舒卿.面向大规模非平衡数据集的潜在家庭宽带用户识别问题研究《.中国优秀硕士学位论文全文数据库 (信息科技辑)》.2020,(第07期),第I138-373页.李尧.复杂环境下数据流自适应学习策略及其应用研究《.中国优秀硕士学位论文全文数据库 (信息科技辑)》.2020,(第01期),第I138-904页.陈伟宏.基于分类器选择的集成学习算法研究《.中国优秀硕士学位论文全文数据库 (信息科技辑)》.2021,(第02期),第I138-836页.Kavita Mittal et al..Performancestudy of K-nearest neighbor classifierand K-means clustering for predicting thediagnostic accuracy《.InternationalJournal of Information Technology》.2018,第535–540页.杜娟;刘志刚;衣治安.一种适用于不均衡数据集分类的KNN算法.科学技术与工程.2011,(第12期),第2680-2685页.
-