基于网络表示学习的计算疾病相似度系统

    公开(公告)号:CN112151184B

    公开(公告)日:2021-05-07

    申请号:CN202011035456.3

    申请日:2020-09-27

    Abstract: 基于网络表示学习的计算疾病相似度系统,涉及疾病相似度计算领域,特别涉及一种基于网络表示学习的计算疾病相似度系统,包括:信息融合模块:用于处理提取HumanNet信息、计算两个Go_term之间的相似度,测量基因之间的相似度;网络嵌入模块:用于将每个基因转化为向量形式;疾病相似度计算模块:基于基因的向量表示和疾病相关基因数据DisGeNET将疾病相关基因融合,得到疾病的向量表示,利用疾病向量表示度量疾病的相似性;基因与疾病预测模块:实现基于基因的向量表示,结合MLP模型,对基因与疾病之间的关系进行预测的功能;本发明用于提升计算疾病相似度的准确性。

    一种细胞类型划分的推断方法
    32.
    发明公开

    公开(公告)号:CN120032719A

    公开(公告)日:2025-05-23

    申请号:CN202311554149.X

    申请日:2023-11-21

    Abstract: 本发明公开提供一种细胞类型划分的推断方法,属于生物信息学领域,该方法利用零膨胀负二项(ZINB)模型对scRNA‑seq数据进行降噪。随后,该方法采用自适应图对比表示学习方法,使用近似个性化传播的神经预测图卷积作为图对比学习的编码器。这确保了每个单元的表示不仅捕获了它的单个特征,而且反映了它在图中的位置以及它与其他单元的关系。图对比学习利用节点之间的关系来捕获单元之间的相似性,更好地表示数据的潜在连续性和复杂拓扑结构。最后,利用Kullback‑Leibler散度对学习到的低维潜在表征进行聚类。

    一种基于多组学数据识别细胞通讯的方法

    公开(公告)号:CN119323992A

    公开(公告)日:2025-01-17

    申请号:CN202411311555.8

    申请日:2024-09-20

    Abstract: 本发明提出了一种基于多组学数据识别细胞通讯的方法,通过以下步骤实现:步骤一,获取单细胞和空间转录组数据集。步骤二,对单细胞和空间转录组学数据集进行预处理。步骤三,构建深度神经网络模型。步骤四,将预处理后的单细胞和空间转录组学数据集对构建的深度神经网络模型进行训练。步骤五,将训练后的深度神经网络模型对待测数据进行细胞间通讯识别。本发明在多套单细胞和空间转录组学数据集上,可取得优秀的识别细胞间通讯的效果。通过与其它最新的细胞间通讯识别方法进行比较具有在多个评价指标上均表现出更优秀的性能。此外,在面对不同程度的噪声的情况下以及缺失的空间转录组数据集上,都取得了较高的稳定性和准确性。

    基于图注意力的lncRNA功能预测方法、存储介质及设备

    公开(公告)号:CN119274661A

    公开(公告)日:2025-01-07

    申请号:CN202411316315.7

    申请日:2024-09-20

    Abstract: 基于图注意力的lncRNA功能预测方法、存储介质及设备,属于生物信息技术学领域。为了解决现有lncRNA功能预测方法中先验的lncRNA功能注释数据很少,需要借用蛋白质功能注释数据来间接预测lncRNA的功能导致准确率较低的问题。本发明首先运用基于交叉注意力机制的图对比学习方法提取多种lncRNA相似性信息,生成综合相似性矩阵;然后利用知识图谱嵌入模型提取GO图中GO术语的特征,生成GO语义相似性矩阵;最后构建GCN和GAT结合的图表示学习模型学习到lncRNA和GO的特征,采用KAN分类器预测lncRNA的GO功能注释信息。本发明所提出的方法能够有效提升lncRNA功能预测的准确率。

    基于stacking集成学习策略的Cas蛋白预测方法

    公开(公告)号:CN115240775B

    公开(公告)日:2023-10-03

    申请号:CN202210843836.2

    申请日:2022-07-18

    Abstract: 基于stacking集成学习策略的Cas蛋白预测方法,涉及一种Cas蛋白预测方法。为了解决目前Cas蛋白识别方法中在模型构建及特征工程方面存在着一定的局限性,导致无法达到理想的预测效果问题。本发明利用双层预测模型对潜在Cas蛋白进行识别;所述双层预测模型的建立过程中,首先获取Cas蛋白序列数据集,使用基于序列模式特征、进化信息特征、理化性质特征、深度表示学习特征的编码对Cas蛋白数据进行编码,构建初始特征空间;然后通过对初始特征空间进行特征空间优化,利用最优特征空间构建多个基学习模型,再基于多个基学习模型输出的置信度得分特征作为第二层模型的输入特征,进行二次建模,构建得到双层预测模型。

    基于暹罗结构与图对比学习的DDI预测方法

    公开(公告)号:CN116543852A

    公开(公告)日:2023-08-04

    申请号:CN202310317847.1

    申请日:2023-03-29

    Abstract: 本发明公开了一种基于暹罗结构与图对比学习的DDI预测方法,包括:收集药物‑药物相互作用文本数据以及药物的理化性质数据文件和靶向关系数据文件;提取药物的理化性质特征以及靶向关系特征,进行融合后获取基于药物理化性质与靶向关系的初始特征;计算药物‑药物相互作用邻接矩阵,结合初始特征构建药物‑药物相互作用异构图;将异构图输入到基于暹罗结构的图对比学习模型中,学习获得药物节点的嵌入特征;利用链路预测方法计算任意两个药物节点之间边的得分。本发明能够缓解当药物靶向关系特征和药物‑药物相互作用文本数据稀疏时难以单独使用、对模型性能产生影响的问题,提高了药物‑药物相互作用预测的准确率,可应用于识别药物之间潜在的相互作用。

    基于深度自动编码器的lncRNA-蛋白质相互作用预测方法

    公开(公告)号:CN115547407B

    公开(公告)日:2023-04-18

    申请号:CN202211287199.1

    申请日:2022-10-20

    Abstract: 基于深度自动编码器的lncRNA‑蛋白质相互作用预测方法,涉及生物信息学领域。本发明是为了解决现有lncRNA‑蛋白质相互作用预测方法还存在特征表达能力低导致的样本在特征空间的分布区别不大,进而导致lncRNA‑蛋白质相互作用的预测准确率低的问题。本发明包括:获取待预测的lncRNA初始特征和蛋白质初始特征,并将待预测的lncRNA初始特征和蛋白质初始特征输入到训练好的lncRNA‑蛋白质相互作用预测模型中,获得相互作用预测结果;本发明利用边际Fisher分析方法学习lncRNA‑蛋白质相互作用样本的最优分类特征,提高了lncRNA‑蛋白质相互作用预测的准确率。本发明用于预测lncRNA‑蛋白质相互作用关系。

    一种植物抗盐碱基因的识别方法及系统

    公开(公告)号:CN115295081A

    公开(公告)日:2022-11-04

    申请号:CN202211085757.6

    申请日:2022-09-06

    Abstract: 一种植物抗盐碱基因的识别方法及系统,具体涉及一种基于机器学习的植物抗盐碱基因的识别方法及系统,为解决抗盐碱基因识别方法依赖植物同源基因的识别,识别结果假阳性率和假阴性率都很高,导致植物抗盐碱功能基因识别准确率低的问题,它包括获取若干条已知是否为抗盐碱基因的植物蛋白序列;获取植物蛋白序列的特征向量;构建C4.5算法模型,用特征向量对C4.5算法模型进行训练,输出基因是否为抗盐碱基因,得到训练好的C4.5算法模型;对待识别的植物蛋白序列执行S2,得到特征向量,将特征向量输入训练好的C4.5算法模型,得到待识别的植物蛋白序列是否含有抗盐碱基因。所述系统执行如所述方法的任一步骤。属于基因识别领域。

    基于有监督的协同图对比学习的药物-靶标相互作用预测方法

    公开(公告)号:CN114023464B

    公开(公告)日:2022-08-09

    申请号:CN202111323363.5

    申请日:2021-11-08

    Abstract: 基于有监督的协同图对比学习的药物‑靶标相互作用预测方法,它属于药物与靶标关系预测技术领域。本发明解决了传统机器学习方法需要依赖繁琐手工进行特征提取以及模型存在过多繁杂步骤的问题。本发明的药物‑靶标相互作用预测方法使用图对比学习来增强模型的学习能力,在整个预测的过程中,不需要人工进行操作,即不依赖繁琐手工进行特征提取,并应用端到端的思想减少了模型的处理步骤,降低了模型的复杂度,同时保证了较高的预测准确率。通过实验得到,本发明预测方法的Roc曲线下面积可以达到0.9764,PR曲线下面积可以达到0.9761。本发明可以用于对药物与靶标关系进行预测。

Patent Agency Ranking