一种识别DNA序列中增强子及其活性强度的预测方法

    公开(公告)号:CN118942544A

    公开(公告)日:2024-11-12

    申请号:CN202410992982.0

    申请日:2024-07-24

    Abstract: 本发明公开了一种识别DNA序列中增强子及其活性强度的预测方法,采用独热编码(One‑hot)和核苷酸化学性质(NCP)进行编码。使用改善的密集连接网络(Dense Net)从原始的特征编码中提取高级特征;利用自注意力模块对高级特征的重要性进行评估,然后输入到全连接神经网络中得到预测概率;采用五折交叉验证的评估方式对模型性能进行评估,通过投票对最终分类结果进行集成学习;使用灵敏度(Sn)、特异性(Sp)、准确度(Acc)、马修斯相关系数(MCC)和ROC曲线下面积(AUC)等五个评估指标衡量模型;采用独立测试和进行模型预测能力的验证,相比于最先进的方法,我们的模型在识别增强子及其强度上有了显著的性能提升。

    一种可解释机器学习模型诊断肝炎患者的预测方法

    公开(公告)号:CN117238479A

    公开(公告)日:2023-12-15

    申请号:CN202310920542.X

    申请日:2023-07-26

    Abstract: 本发明公开了一种根据血液检测结果诊断肝炎患者的可解释机器学习预测方法,其特征在于主要包含以下步骤:获取肝炎患者的血液检测结果以及肝炎诊断状况;对缺失值进行处理,并使用数据均衡策略,获得540条正样本和等数量的负样本;使用黑盒模型随机森林、支持向量机和AdaBoost进行预测;使用贝叶斯优化和网格优化算法对模型进行处理;选择精度最优的模型作为最终预测模型并输出预测结果;使用AUC、准确率、精确度、F1‑score、召回率五个评估指标衡量模型;使用SHAP对选取出的模型进行全局解释,使用LIME对预测结果进行局部解释。该方法无需侵入性检测,通过非侵入性的血液检测就可以诊断患者是否患有丙型肝炎,同时兼具可解释性,相比于最先进的方法具有更优越的识别性能且预测过程更加透明。

Patent Agency Ranking