一种基于鲁棒多核集成方法的药物靶点交互预测方法及其系统

    公开(公告)号:CN119207547B

    公开(公告)日:2025-05-09

    申请号:CN202411710162.4

    申请日:2024-11-27

    Abstract: 本发明公开了一种基于鲁棒多核集成方法的药物靶点交互预测方法及其系统,该方法包括,构建目标函数,包括关于预测交互矩阵的损失函数,集成学习项和正则项;以已知交互矩阵、药物相似核矩阵集合和靶点相似核矩阵集合为训练数据训练模型以优化所述的目标函数;所述药物相似核矩阵集合包含待测药物,靶点相似核矩阵集合包含待测靶点;训练结束后,模型输出包含待测药物与待测靶点交互置信度的预测交互矩阵。本方案模型利用多核学习、多视角信息融合以及集成学习策略,结合鲁棒损失函数,通过训练在药物‑靶点相互作用矩阵进行重建,可通过对未知药物‑靶点相互作用的预测,扩展已有的药物靶标数据库。

    一种预测药物靶标关联关系的方法

    公开(公告)号:CN119028427A

    公开(公告)日:2024-11-26

    申请号:CN202410914418.7

    申请日:2024-07-09

    Abstract: 本发明涉及一种预测药物靶标关联关系的方法。它解决了现有技术中药物靶标关联预测方法预测准确度不佳的问题。它包括S1、收集并下载药物和蛋白质结构数据以及关联的交互网络;S2、药物和蛋白质结构数据处理,转换交互网络;S3、从结构数据提取并学习药物结构特征和蛋白质的结构特征;S4、设计协同对比学习策略,计算对比学习损失;S5、设计自适应自步采样策略,获得高可靠度的对比学习样本对;S6、获取药物和蛋白质的最终特征表示,利用MLP预测潜在的药物‑靶标(蛋白质)的交互关系。本发明的优点在于:能够更充分地利用多种交互网络之间的互补性知识,从每个交互网络中学习到一致性更高的特征表示,进而提高药物‑靶标关联关系的预测准确度。

    一种鉴定RNA假尿苷位点的新方法
    5.
    发明公开

    公开(公告)号:CN117198396A

    公开(公告)日:2023-12-08

    申请号:CN202311011172.4

    申请日:2023-08-11

    Abstract: 本方案公开了一种鉴定RNA假尿苷位点的新方法,该方法提出使用多种特征表示技术来提取序列特征,然后利用SVM‑RFE方法进行特征选择来压缩特征空间,优化特征子集,将经过特征选择后的最佳特征集输入到基于多项式随机森林的核方法KeMRF中识别序列中的假尿苷位点。KeMRF作为一种新提出的分类方法,与传统的随机森林相比,其不仅优化了节点分裂的判别准则,同时结合易于解释的核方法,使得分类性能更加优越。该方法减少了模型的训练时间,同时提高了模型的分类性能,也进一步提升了对假尿苷位点识别的准确率。

    一种植物中sgRNA活性预测方法及装置

    公开(公告)号:CN113838529A

    公开(公告)日:2021-12-24

    申请号:CN202111138368.0

    申请日:2021-09-27

    Abstract: 本发明提供一种植物中sgRNA活性预测方法及装置,方法包括:下载sgRNA活性序列数据集,sgRNA活性序列数据集包括植物sgRNA活性数据;采用热编码方法对植物sgRNA活性数据进行编码,得到植物sgRNA序列数据;采用k‑mer编码方法对植物sgRNA序列数据进行二次编码;通过编码后的sgRNA活性序列数据集构建卷积神经网络模型;通过卷积神经网络模型按设定次数n分别对编码后的sgRNA活性序列数据集进行预测训练,得到n个训练模型,将n个训练模型集成,得到卷积神经网络预测模型sgRNACNN;将待预测的植物sgRNA活性序列输入卷积神经网络预测模型sgRNACNN中,得到预测结果。本发明的卷积神经网络预测模型sgRNACNN泛化性能较好,可应用于多物种植物sgRNA活性预测,能够实现对sgRNA活性的准确识别,具有较好的实用性能。

    基于图Transformer的蛋白质-配体对接打分模型的构建方法及其系统

    公开(公告)号:CN119360952A

    公开(公告)日:2025-01-24

    申请号:CN202411921316.4

    申请日:2024-12-25

    Abstract: 本发明公开了一种基于图Transformer的蛋白质‑配体对接打分模型的构建方法,包括图神经网络、基于注意力机制的多层网络和解码模块,解码模块包括MND解码模块和pKd解码模块;MND解码模块用于计算蛋白质和配体之间距离概率分布;pKd解码模块用于预测蛋白质和配体结合时的亲和力值;损失函数包括MDN损失和pKd损失,多层网络的第一层具有随着训练迭代更新的用于指示特征被保留或屏蔽的掩码向量,以蛋白质图和配体图为输入进行对接打分预测。本方案模型同时使用了MDN和pKd两个解码模块,MDN从概率分布的角度优化模型参数,而pKd模块则从结合亲和力的角度来优化模型参数,两者分别从空间关系和相互作用关系来进行对接打分,通过两者的配合可有效提升模型的综合评价能力。

    基于序列同源性的特定生物序列预测方法及其系统

    公开(公告)号:CN117953973A

    公开(公告)日:2024-04-30

    申请号:CN202410326309.3

    申请日:2024-03-21

    Abstract: 本发明提供了一种基于序列同源性的特定生物序列预测方法及其系统,包括,准备特定生物序列相关的原始序列数据集;原始序列数据集包括训练集和测试集,训练集用于训练模型,测试集则用于对训练的模型进行测试;构造基于序列同源性评分的模糊隶属函数,用于将序列数据转化成特征向量;构造深度模糊回声状态网络,用于根据特征向量输出预测结果;使用原始序列数据集训练深度模糊回声状态网络。本方案提出基于序列同源性评分的模糊隶属函数将序列数据转化成特征向量,无需手动提取特征,并且可直接处理字符串序列,无需进行特征编码,通过整合序列进化信息有效优化特征空间,不仅减少了模型的训练时间,同时提高了模型的分类性能。

    一种GPCR蛋白序列的识别方法及计算机可读存储介质

    公开(公告)号:CN117437983A

    公开(公告)日:2024-01-23

    申请号:CN202311471325.3

    申请日:2023-11-07

    Abstract: 本发明提供一种GPCR蛋白序列的识别方法及计算机可读存储介质,包括:获取待识别的GPCR蛋白序列,使用PsePSSM提取方法提取蛋白序列的GPCR特征;将所述GPCR特征输入预先训练完成的MLapRVFL分类模型中,得到所述MLapRVFL分类模型输出的识别结果,其中,所述MLapRVFL分类模型是通过将多拉普拉斯和L2,1‑norm正则化项引入基本的随机向量功能链接RVFL方法中进行训练得到的,且所述MLapRVFL分类模型根据Spec、ACC、SN、MCC、AUC至少五个衡量指标衡量MLapRVFL分类模型的准确度,根据实验结果显示,PsePSSM特征提取方法相对于其他特征提取方法在MLapRVFL分类模型上的ACC、AUC衡量指标上能获得了更好的分类效果,本发明相比现有的机器学习方法在GPCR数据集上也有更好的分类性能,且提高了GPCR蛋白质序列的预测准确性。

Patent Agency Ranking