-
公开(公告)号:CN113674864B
公开(公告)日:2023-08-11
申请号:CN202111007447.8
申请日:2021-08-30
Applicant: 重庆大学
IPC: G16H50/30 , G16H50/70 , G06F18/2415 , G06F18/214 , G06F18/25
Abstract: 本发明公开了一种恶性肿瘤合并静脉血栓栓塞症风险预测方法,该方法首先对采集的病人信息进行预处理得到基础数据集,再进行双向联合重采样得到训练集,然后对训练集中每个训练样本进行特征筛选,去掉冗余特征;构建和训练StackingXgbMlp模型,该模型包括两层,第一层包括并联的一个XGBoost模型和一个MLP模型,第二层包括一个XGBoost模型;训练完成后将未知是否患病的病人信息采用S100的方法进行预处理,再采用S300的方法进行特征筛选得到待预测样本,将该待预测样本输入训练好的StackingXgbMlp模型中,输出待预测样本患病的预测概率。实验表明,本发明方法在预测准确性比传统方法好。
-
公开(公告)号:CN116564537A
公开(公告)日:2023-08-08
申请号:CN202310559667.4
申请日:2023-05-18
Applicant: 重庆大学附属肿瘤医院
IPC: G16H50/70 , G06F40/295 , G06F18/213 , G06F18/2413 , G06F18/25 , G06F18/214 , G06N20/00
Abstract: 本发明公开了一种基于机器学习的恶性肿瘤合并VTE风险预测方法,包括如下步骤:获取患者电子病历体征数据和文本数据,进行预处理后进行数据集成;对平衡后的数据进行多指标联合特征筛选,基于XGBoost的特征排序,利用Weight、Cover、Gain三个指标的几何平均值作为排序指标,得到对VTE预测影响较大的特征组合;构建和训练命名实体识别模型REGPS;利用FastText对提取到的患者实体进行词嵌入,将嵌入后得到的特征矩阵X与特征筛选后得到的体征特征组合Y进行特征融合拼接得到患者总体特征矩阵Einput;将Einput输入经过调优后的XGBoost模型,最终得到恶性肿瘤患者合并VTE概率。
-
公开(公告)号:CN113674864A
公开(公告)日:2021-11-19
申请号:CN202111007447.8
申请日:2021-08-30
Applicant: 重庆大学
Abstract: 本发明公开了一种恶性肿瘤合并静脉血栓栓塞症风险预测方法,该方法首先对采集的病人信息进行预处理得到基础数据集,再进行双向联合重采样得到训练集,然后对训练集中每个训练样本进行特征筛选,去掉冗余特征;构建和训练StackingXgbMlp模型,该模型包括两层,第一层包括并联的一个XGBoost模型和一个MLP模型,第二层包括一个XGBoost模型;训练完成后将未知是否患病的病人信息采用S100的方法进行预处理,再采用S300的方法进行特征筛选得到待预测样本,将该待预测样本输入训练好的StackingXgbMlp模型中,输出待预测样本患病的预测概率。实验表明,本发明方法在预测准确性比传统方法好。
-
-