基于乳腺癌数据的变量筛选方法及系统、可读存储介质

    公开(公告)号:CN115346682A

    公开(公告)日:2022-11-15

    申请号:CN202211271041.5

    申请日:2022-10-18

    Abstract: 本申请提供了一种基于乳腺癌数据的变量筛选方法及系统、可读存储介质,属于医疗数据处理技术领域,基于乳腺癌数据的变量筛选方法包括:获取乳腺癌数据;对乳腺癌数据进行预处理,预处理包括数据归一化和异常值处理;通过最大信息系数法对预处理后的乳腺癌数据进行相关性分析,得出第一筛选结果;对第一筛选结果进行变量筛选,得出第二筛选结果,变量筛选的方法包括以下之一或其组合:Lasso算法、随机森林、SIS变量筛选和DC‑SIS变量筛选。通过本申请的技术方案,能够解决变量之间边际不相关、联合相关的问题,降低了错误率,使数据更具有生物学意义。

    基于乳腺癌变量的分类模型建立方法及系统、存储介质

    公开(公告)号:CN115358351A

    公开(公告)日:2022-11-18

    申请号:CN202211283066.7

    申请日:2022-10-18

    Abstract: 本申请提供了一种基于乳腺癌变量的分类模型建立方法及系统、存储介质,属于医疗数据处理技术领域,基于乳腺癌变量的分类模型建立方法包括:获取乳腺癌数据,对乳腺癌数据进行预处理;基于乳腺癌数据建立数据集,并根据数据集划分出训练集和测试集,划分数据集的方法包括以下之一:随机子抽样验证法、交叉验证法和自助法;基于数据集进行变量筛选,得出筛选结果;基于筛选结果,通过Adaboost分类器和/或随机森林分类器建立分类模型;通过模型评价指标对分类模型进行评价,模型评价指标包括精准率、召回率、F1值和ROC曲线。通过本申请的技术方案,能够提高乳腺癌重要变量的预测精度,有利于医疗预防和筛查防护。

Patent Agency Ranking