-
公开(公告)号:CN117238479A
公开(公告)日:2023-12-15
申请号:CN202310920542.X
申请日:2023-07-26
Applicant: 桂林电子科技大学
IPC: G16H50/20 , G16H50/30 , G06F18/243 , G06N20/00
Abstract: 本发明公开了一种根据血液检测结果诊断肝炎患者的可解释机器学习预测方法,其特征在于主要包含以下步骤:获取肝炎患者的血液检测结果以及肝炎诊断状况;对缺失值进行处理,并使用数据均衡策略,获得540条正样本和等数量的负样本;使用黑盒模型随机森林、支持向量机和AdaBoost进行预测;使用贝叶斯优化和网格优化算法对模型进行处理;选择精度最优的模型作为最终预测模型并输出预测结果;使用AUC、准确率、精确度、F1‑score、召回率五个评估指标衡量模型;使用SHAP对选取出的模型进行全局解释,使用LIME对预测结果进行局部解释。该方法无需侵入性检测,通过非侵入性的血液检测就可以诊断患者是否患有丙型肝炎,同时兼具可解释性,相比于最先进的方法具有更优越的识别性能且预测过程更加透明。
-
公开(公告)号:CN118098572A
公开(公告)日:2024-05-28
申请号:CN202410324041.X
申请日:2024-03-21
Applicant: 桂林电子科技大学
Abstract: 本发明公开了一种根据血液检测结果诊断患者肝纤维化分期状态的可解释OPTUNADF检测方法,获取肝纤维化患者的血液检测结果以及肝纤维化诊断状况;对特征进行标准化,并对异常值进行处理,使用数据均衡策略,获得均衡化后的数据集,使用前向特征选择筛选最相关特征子集;使用级联森林模型深度森林(DF)对数据集进行预测;使用OPTUNA超参数优化框架对模型进行处理;迭代100次,选择精度最优的超参数并输出OPTUNADF的预测结果;采用五折交叉验证的评估方式对模型性能进行评估,使用ROC、准确率、精确度、F1‑score、召回率五个评估指标衡量模型;使用SHAP中的kernelExplainer构建模型解释器对步骤5)中选取出的模型进行全局解释和局部解释。该方法无需侵入性检测,通过非侵入性的血液检测就可以诊断患者肝纤维化状态,同时兼具可解释性,相比于最先进的方法具有更优越的识别性能且预测过程更加透明。
-
公开(公告)号:CN117672367A
公开(公告)日:2024-03-08
申请号:CN202311297790.X
申请日:2023-10-09
Applicant: 桂林电子科技大学
Abstract: 本发明公开了一种环状RNA亚细胞定位的预测方法,其特征包含如下步骤:获取含有携带亚细胞定位信息的环状RNA序列;使用CD‑HIT软件去除相似度超过80%的同源性序列;使用8‑mer划分RNA序列并计算每个短序列出现的频率特征,根据RNA二核苷酸物理化学性质计算自协方差与交叉协方差组成DACC特征;使用工具提取RNA序列的数学统计特征;使用IFS方法对8‑mer特征进行第一次特征选择,经过筛选的特征与DACC特征、数学特征进行融合,然后使用RFE方法进行第二次特征选择;将特征选择后的特征集输入到岭回归模型得到预测结果;采用十折交叉验证的评估方式对模型性能进行评估。该方法可以仅通过数学手段提取RNA序列中的特征,与基于生物学知识提取的序列特征相结合可以显著提高模型预测的能力。
-
公开(公告)号:CN118800452A
公开(公告)日:2024-10-18
申请号:CN202410993056.5
申请日:2024-07-24
Applicant: 桂林电子科技大学
IPC: G16H50/30 , G16H50/70 , G06F18/214 , G06N20/10 , G06N5/01 , G06F18/23213 , G06N3/0985
Abstract: 本发明公开了一种基于聚类下采样和可解释深度森林的脑卒中预测方法,获取脑卒中和正常患者的代谢指标以及分类情况;对特征进行标准化,并对异常值进行处理,获取完整的、标准化数据;使用提出的CBUC算法对不平衡数据重采样,尽可能多地将多类型的数据纳入训练,得到一个平衡训练集;使用级联深度森林模型(DF)对数据集进行预测;采用Grid search技术对预测的模型进行优化;采用10折交叉验证对模型的性能进行评估,使用Specificity(SP)、Sensitivity(SE)、Gmean、Area Under the Curve(AUC)以及Accuracy(ACC)五个指标衡量模型性能;计算深度模型中第一层森林的MDI,对输入的特征进行重要性比较。该方法将极度不平衡脑卒中数据重采样为平衡数据集,提高模型的预测精度,同时兼具可解释性,相比于最先进的方法具有更优越的识别性能且预测过程更加透明。
-
公开(公告)号:CN116779182A
公开(公告)日:2023-09-19
申请号:CN202310822955.4
申请日:2023-07-06
Applicant: 桂林电子科技大学
IPC: G16H50/80 , G16H50/20 , G16H10/40 , G16H15/00 , G16H50/30 , G06F18/10 , G06F18/2411 , G06F18/243 , G06F18/21 , G06N20/20
Abstract: 在这项发明将使用一个集成学习模型(REGX)中来进行COVID‑19的诊断和预后。该集成学习模型使用了两层的多个分类器来提升模型性能。第一级多样化分类器包括额外树、随机森林、梯度提升和极端梯度提升模型,之后第一层的输出被送至第二层SVM分类器。同时,在数据预处理时,本文采用KNNImputer算法来处理空值,使用iForest来筛选异常值,之后再用少数过采样技术(SMOTE)来使数据分布均衡。最后,通过Feature_Importances(scikit‑Learn)和SHapley Additive exPlanations(SHAP)来报告特征重要性,以满足医疗环境中模型可解释性的需求。最后,通过sklearn中的Feature_Importances和SHAP事后可解释性来揭示黑盒模型中揭示由于新型冠状病毒感染感染患者剧增而可能被医疗从业者忽略的重要的生物标志物。
-
公开(公告)号:CN114974401A
公开(公告)日:2022-08-30
申请号:CN202210500209.9
申请日:2022-05-09
Applicant: 桂林电子科技大学
Abstract: 本发明公开了一种涉及生物信息领域的基于堆叠式集成策略用于高效识别特定细胞系增强子‑启动子相互作用的预测方法。该预测方法的步骤为:获取6个特定的人类细胞系中的增强子、启动子基因序列,对所有的细胞系的非平衡序列数据进行相同的数据预处理;使用6种特征提取方式提取特征;使用7种计算方法以堆叠式集成的方式训练模型。输入数据获得初步预测结果;调整特征提取方式和计算方法的组合方式优化集成模型,得到最终的预测结果。该方法提取基因序列中的多种信息特征,减少了计算时间,提高了预测特定细胞系增强子‑启动子相互作用的效果。
-
公开(公告)号:CN114898147A
公开(公告)日:2022-08-12
申请号:CN202210496116.3
申请日:2022-05-09
Applicant: 桂林电子科技大学
IPC: G06V10/764 , G06V10/774 , G06V10/82 , G06V10/40 , G06K9/62 , G06N3/04 , G06N3/08
Abstract: 本发明是一种基于双端多注意力学习的新冠肺炎胸片图像分类系统,尤其涉及医学图像处理领域。近年来,深度学习模型广泛应用于计算机视觉的多个领域,并且取得了突破性进展。例如器官组织分割、肺部病理检测,以及诊断报告的自动生成。这促使许多研究人员尝试使用深度学习技术来解决目前的困境。然而,这些早期的研究由于数据限制和不统一以及模型的单调,在大数据集上的诊断效果并没有那么理想。注意机制目的是让深度学习模型能够重点关注关键信息,从而学习更具鉴别性的特征表示。根据已有的研究,将注意机制融入深度模型已经在定位、跟踪、视觉问题回答和分割等视觉任务上取得重大突破。所提出的系统将多种网络和多种注意力机制结合,提高了新冠肺炎的筛查效率和诊断精度。实验结果也证明了该系统可以成为新冠肺炎疾病诊断的自动化解决方案。
-
-
-
-
-
-