-
公开(公告)号:CN116564537A
公开(公告)日:2023-08-08
申请号:CN202310559667.4
申请日:2023-05-18
Applicant: 重庆大学附属肿瘤医院
IPC: G16H50/70 , G06F40/295 , G06F18/213 , G06F18/2413 , G06F18/25 , G06F18/214 , G06N20/00
Abstract: 本发明公开了一种基于机器学习的恶性肿瘤合并VTE风险预测方法,包括如下步骤:获取患者电子病历体征数据和文本数据,进行预处理后进行数据集成;对平衡后的数据进行多指标联合特征筛选,基于XGBoost的特征排序,利用Weight、Cover、Gain三个指标的几何平均值作为排序指标,得到对VTE预测影响较大的特征组合;构建和训练命名实体识别模型REGPS;利用FastText对提取到的患者实体进行词嵌入,将嵌入后得到的特征矩阵X与特征筛选后得到的体征特征组合Y进行特征融合拼接得到患者总体特征矩阵Einput;将Einput输入经过调优后的XGBoost模型,最终得到恶性肿瘤患者合并VTE概率。