-
公开(公告)号:CN118398233A
公开(公告)日:2024-07-26
申请号:CN202410818192.0
申请日:2024-06-24
Applicant: 湘江实验室
Abstract: 本发明属于数据分析处理技术领域,具体涉及一种面向不平衡医疗数据集的分析处理方法,包括:采集不平衡医疗数据集,并进行标准化处理;对标准化后的不平衡训练数据集构建SVM模型,并分别识别少数类和多数类的支持向量、及采用EDR方法分别估计多数类和少数类支持向量的数据范围;基于多数类支持向量,结合模糊三角函数和#imgabs0#方法进行欠采样处理,挑选出所有价值的多数类的支持向量;基于少数类支持向量,采用ELM‑ABC方法进行过采样处理,生成更多少数类支持向量;将经欠采样处理后的多数类和经过采样处理后的少数类支持向量组成平衡医疗数据集。采用双重采样的方法对不平衡医疗数据集平衡化处理,达到平衡数据的目的。
-
公开(公告)号:CN118398233B
公开(公告)日:2024-09-13
申请号:CN202410818192.0
申请日:2024-06-24
Applicant: 湘江实验室
Abstract: 本发明属于数据分析处理技术领域,具体涉及一种面向不平衡医疗数据集的分析处理方法,包括:采集不平衡医疗数据集,并进行标准化处理;对标准化后的不平衡训练数据集构建SVM模型,并分别识别少数类和多数类的支持向量、及采用EDR方法分别估计多数类和少数类支持向量的数据范围;基于多数类支持向量,结合模糊三角函数和#imgabs0#方法进行欠采样处理,挑选出所有价值的多数类的支持向量;基于少数类支持向量,采用ELM‑ABC方法进行过采样处理,生成更多少数类支持向量;将经欠采样处理后的多数类和经过采样处理后的少数类支持向量组成平衡医疗数据集。采用双重采样的方法对不平衡医疗数据集平衡化处理,达到平衡数据的目的。
-