一种基于机器学习的生物标志物扩维筛选方法

    公开(公告)号:CN112710722A

    公开(公告)日:2021-04-27

    申请号:CN201911026970.8

    申请日:2019-10-26

    Applicant: 复旦大学

    Abstract: 本发明属于生物标志物领域,涉及生物标志物扩维筛选方法,具体涉及一种基于扩维算法和机器学习的生物标志物筛选和疾病分类的方法。本发明方法中,首先对生物标志物进行质谱定量数据采集,并进行预处理,获得特征数据集,再利用自动化工具对特征数据集进行扩维计算,引入代表生物标志物表达相关性的新特征,最后利用正交偏最小二乘法判别分析算法对特征进行分类和筛选;扩维筛选后,数据集有更好的分类效果,同时扩维后的特征数据在疾病判别中灵敏度和特异性明显高于单一生物分子(ROC曲线下的面积),利用随机森林算法对疾病进行成功分类,准确率达到0.97。

Patent Agency Ranking