-
公开(公告)号:CN115358351A
公开(公告)日:2022-11-18
申请号:CN202211283066.7
申请日:2022-10-18
Applicant: 中国地质大学(北京)
Abstract: 本申请提供了一种基于乳腺癌变量的分类模型建立方法及系统、存储介质,属于医疗数据处理技术领域,基于乳腺癌变量的分类模型建立方法包括:获取乳腺癌数据,对乳腺癌数据进行预处理;基于乳腺癌数据建立数据集,并根据数据集划分出训练集和测试集,划分数据集的方法包括以下之一:随机子抽样验证法、交叉验证法和自助法;基于数据集进行变量筛选,得出筛选结果;基于筛选结果,通过Adaboost分类器和/或随机森林分类器建立分类模型;通过模型评价指标对分类模型进行评价,模型评价指标包括精准率、召回率、F1值和ROC曲线。通过本申请的技术方案,能够提高乳腺癌重要变量的预测精度,有利于医疗预防和筛查防护。
-
公开(公告)号:CN115346682A
公开(公告)日:2022-11-15
申请号:CN202211271041.5
申请日:2022-10-18
Applicant: 中国地质大学(北京)
IPC: G16H50/70
Abstract: 本申请提供了一种基于乳腺癌数据的变量筛选方法及系统、可读存储介质,属于医疗数据处理技术领域,基于乳腺癌数据的变量筛选方法包括:获取乳腺癌数据;对乳腺癌数据进行预处理,预处理包括数据归一化和异常值处理;通过最大信息系数法对预处理后的乳腺癌数据进行相关性分析,得出第一筛选结果;对第一筛选结果进行变量筛选,得出第二筛选结果,变量筛选的方法包括以下之一或其组合:Lasso算法、随机森林、SIS变量筛选和DC‑SIS变量筛选。通过本申请的技术方案,能够解决变量之间边际不相关、联合相关的问题,降低了错误率,使数据更具有生物学意义。
-