一种可解释OPTUNADF的肝纤维化状况诊断方法

    公开(公告)号:CN118098572A

    公开(公告)日:2024-05-28

    申请号:CN202410324041.X

    申请日:2024-03-21

    Abstract: 本发明公开了一种根据血液检测结果诊断患者肝纤维化分期状态的可解释OPTUNADF检测方法,获取肝纤维化患者的血液检测结果以及肝纤维化诊断状况;对特征进行标准化,并对异常值进行处理,使用数据均衡策略,获得均衡化后的数据集,使用前向特征选择筛选最相关特征子集;使用级联森林模型深度森林(DF)对数据集进行预测;使用OPTUNA超参数优化框架对模型进行处理;迭代100次,选择精度最优的超参数并输出OPTUNADF的预测结果;采用五折交叉验证的评估方式对模型性能进行评估,使用ROC、准确率、精确度、F1‑score、召回率五个评估指标衡量模型;使用SHAP中的kernelExplainer构建模型解释器对步骤5)中选取出的模型进行全局解释和局部解释。该方法无需侵入性检测,通过非侵入性的血液检测就可以诊断患者肝纤维化状态,同时兼具可解释性,相比于最先进的方法具有更优越的识别性能且预测过程更加透明。

    一种环状RNA亚细胞定位的预测方法

    公开(公告)号:CN117672367A

    公开(公告)日:2024-03-08

    申请号:CN202311297790.X

    申请日:2023-10-09

    Abstract: 本发明公开了一种环状RNA亚细胞定位的预测方法,其特征包含如下步骤:获取含有携带亚细胞定位信息的环状RNA序列;使用CD‑HIT软件去除相似度超过80%的同源性序列;使用8‑mer划分RNA序列并计算每个短序列出现的频率特征,根据RNA二核苷酸物理化学性质计算自协方差与交叉协方差组成DACC特征;使用工具提取RNA序列的数学统计特征;使用IFS方法对8‑mer特征进行第一次特征选择,经过筛选的特征与DACC特征、数学特征进行融合,然后使用RFE方法进行第二次特征选择;将特征选择后的特征集输入到岭回归模型得到预测结果;采用十折交叉验证的评估方式对模型性能进行评估。该方法可以仅通过数学手段提取RNA序列中的特征,与基于生物学知识提取的序列特征相结合可以显著提高模型预测的能力。

    一种基于聚类下采样和可解释深度森林的脑卒中预测方法

    公开(公告)号:CN118800452A

    公开(公告)日:2024-10-18

    申请号:CN202410993056.5

    申请日:2024-07-24

    Abstract: 本发明公开了一种基于聚类下采样和可解释深度森林的脑卒中预测方法,获取脑卒中和正常患者的代谢指标以及分类情况;对特征进行标准化,并对异常值进行处理,获取完整的、标准化数据;使用提出的CBUC算法对不平衡数据重采样,尽可能多地将多类型的数据纳入训练,得到一个平衡训练集;使用级联深度森林模型(DF)对数据集进行预测;采用Grid search技术对预测的模型进行优化;采用10折交叉验证对模型的性能进行评估,使用Specificity(SP)、Sensitivity(SE)、Gmean、Area Under the Curve(AUC)以及Accuracy(ACC)五个指标衡量模型性能;计算深度模型中第一层森林的MDI,对输入的特征进行重要性比较。该方法将极度不平衡脑卒中数据重采样为平衡数据集,提高模型的预测精度,同时兼具可解释性,相比于最先进的方法具有更优越的识别性能且预测过程更加透明。

    一种基于深度学习的ncRNA与蛋白质相互作用的预测方法

    公开(公告)号:CN119763670A

    公开(公告)日:2025-04-04

    申请号:CN202411931046.5

    申请日:2024-12-26

    Abstract: 本发明公开了一种基于深度学习模型对于ncRNA与蛋白质相互作用的预测方法,使用的是公共数据库四个数据集(RPI488,NPInter2.0,RPI1807,RPI7317),kmer编码策略对ncRNA和蛋白质的序列进行提取高维稀疏特征后,通过Embedding层将稀疏特征映射为低维稠密向量;使用ResNet结合SE注意力机制提取关键的局部特征;随后通过Transformer利用位置编码和多头注意力捕捉长程依赖并提取全局特征;最终,将ResNet和Transformer的特征与线性变换后的蛋白质特征拼接,并通过DNN层进一步提炼特征后使用Sigmoid激活函数输出分类概率。通过正则化等技术来防止模型过拟合,使用十折交叉验证以及独立测试集来对模型进行性能测试。该方法使用k‑mer进行特征编码,不需要生物学的先验知识,并且通过局部特征提取与全局特征建模相结合的方式,充分捕获序列中的关键信息,利用深度学习的计算方法提高了预测ncRNA与蛋白质相互作用的准确率。

Patent Agency Ranking