-
公开(公告)号:CN117056840A
公开(公告)日:2023-11-14
申请号:CN202310831071.5
申请日:2023-07-07
Applicant: 福建师范大学
IPC: G06F18/2433 , G01N21/65 , G06F18/15 , G06F18/2135 , G06F18/232 , G06N20/00
Abstract: 本发明公开一种血清SERS光谱数据的异常检测方法,首先通过SERS技术采集不同种类癌症的血清SERS光谱信号;对采集的光谱数据进行预处理;接着使用主成分分析技术将每个拉曼光谱数据的信号降维至低维空间;利用基于密度的噪声应用空间聚类算法对光谱数据进行聚类,通过设置调节参数epsilon和MinPts以控制聚类的结果;最后对于每个聚类簇计算中心点以及每个样本点与中心点之间的距离。某个样本点与中心点之间的距离大于预设阈值,则将该样本点视为异常点,并将其从聚类簇中移除。引入机器学习分类算法显著提高分类的准确率。五折交叉验证方法寻找到建模的最佳参数组合输出最佳的血清SERS分类模型。本发明有效提高分类算法模型的准确率。
-
公开(公告)号:CN115908414A
公开(公告)日:2023-04-04
申请号:CN202310017167.8
申请日:2023-01-06
Applicant: 福建师范大学
IPC: G06T7/00 , G06V10/764 , G06V10/25 , G06N3/04 , G06N3/08 , G06N3/0464
Abstract: 本发明公开一种不平衡血清SERS光谱数据的分类方法,通过SERS技术采集到不同种类癌症的血清SERS光谱信号。拟合出不同种类癌症患病分布的幂律函数,随后引入幂律调节系数γ引导少数类使用SMOTE算法生成少数类样本以使各类别达到相对平衡,最后使用人工神经网络算法对血清SERS光谱进行分类。本发明有效抵抗样本不均衡的学习偏见,提高分类算法模型的准确率。基于幂律分布生成的少数类采样策略结合SMOTE数据合成方法生成各个类别相对均衡的数据集,有效减轻数据不平衡问题造成的建模问题。使得少数类样本不会因为数量过少而偏向多数类建模,也有效杜绝传统SMOTE算法将所有少数类合成至多数类规模时模糊分类边界的问题。
-