一种基于深度学习的ncRNA与蛋白质相互作用的预测方法

    公开(公告)号:CN119763670A

    公开(公告)日:2025-04-04

    申请号:CN202411931046.5

    申请日:2024-12-26

    Abstract: 本发明公开了一种基于深度学习模型对于ncRNA与蛋白质相互作用的预测方法,使用的是公共数据库四个数据集(RPI488,NPInter2.0,RPI1807,RPI7317),kmer编码策略对ncRNA和蛋白质的序列进行提取高维稀疏特征后,通过Embedding层将稀疏特征映射为低维稠密向量;使用ResNet结合SE注意力机制提取关键的局部特征;随后通过Transformer利用位置编码和多头注意力捕捉长程依赖并提取全局特征;最终,将ResNet和Transformer的特征与线性变换后的蛋白质特征拼接,并通过DNN层进一步提炼特征后使用Sigmoid激活函数输出分类概率。通过正则化等技术来防止模型过拟合,使用十折交叉验证以及独立测试集来对模型进行性能测试。该方法使用k‑mer进行特征编码,不需要生物学的先验知识,并且通过局部特征提取与全局特征建模相结合的方式,充分捕获序列中的关键信息,利用深度学习的计算方法提高了预测ncRNA与蛋白质相互作用的准确率。

    一种识别DNA序列中增强子及其活性强度的预测方法

    公开(公告)号:CN118942544A

    公开(公告)日:2024-11-12

    申请号:CN202410992982.0

    申请日:2024-07-24

    Abstract: 本发明公开了一种识别DNA序列中增强子及其活性强度的预测方法,采用独热编码(One‑hot)和核苷酸化学性质(NCP)进行编码。使用改善的密集连接网络(Dense Net)从原始的特征编码中提取高级特征;利用自注意力模块对高级特征的重要性进行评估,然后输入到全连接神经网络中得到预测概率;采用五折交叉验证的评估方式对模型性能进行评估,通过投票对最终分类结果进行集成学习;使用灵敏度(Sn)、特异性(Sp)、准确度(Acc)、马修斯相关系数(MCC)和ROC曲线下面积(AUC)等五个评估指标衡量模型;采用独立测试和进行模型预测能力的验证,相比于最先进的方法,我们的模型在识别增强子及其强度上有了显著的性能提升。

Patent Agency Ranking