-
公开(公告)号:CN118711675A
公开(公告)日:2024-09-27
申请号:CN202411154210.6
申请日:2024-08-22
Applicant: 之江实验室
IPC: G16B40/00 , G16B20/00 , G06N3/042 , G06N3/0455 , G06N3/047 , G06N3/0475 , G06N3/088
Abstract: 本发明公开了一种基于变分图自编码器的基因量化表征方法和系统,方法包括以下步骤:根据蛋白质互作网络数据构建蛋白质互作网络有向图;根据基因本体论数据构建包括生物学过程树图、细胞成分树图和分子功能树图的三棵树图;分别计算三棵树图中根节点与目标基因的节点之间的非冗余最短路径作为目标基因的初级量化表征;将目标基因分别在三棵树图中的初级量化表征融合后再与蛋白质互作网络有向图结合,得到高级蛋白质互作网络有向图;将高级蛋白质互作网络有向图输入基于变分图自编码器的图神经网络模型中实现基因高级量化表征。本发明基于PPI、GO和变分图自编码器实现了单细胞基因的高效量化表征,为生物医学研究提供了深度和精度。
-
公开(公告)号:CN119517171A
公开(公告)日:2025-02-25
申请号:CN202510081736.4
申请日:2025-01-20
Applicant: 之江实验室
Abstract: 本发明公开了一种功能蛋白质挖掘和筛选方法及装置,将蛋白结构预测、蛋白质功能注释、蛋白簇挖掘等多维度的生物信息学分析与基于蛋白质大语言的人工智能方法结合起来,构建了一个针对功能蛋白的挖掘和筛选的流程。引入蛋白质的结构分析,利用蛋白质结构与功能的关联,通过构建结构相似性图谱,发掘功能相近的蛋白。蛋白质大语言模型能够包含蛋白结构,翻译后修饰和生物物理学特性等与蛋白质功能相关的特征参数,并以向量矩阵的形式揭示蛋白内在的功能关联性。通过引入这两种分析手段,并结合传统的基于序列的蛋白质功能注释的方法,使得序列相似性和亲缘度更低,但是拥有相应功能的蛋白被挖掘和筛选出来,从而能够更加高效精准地利用生物大分子。
-
公开(公告)号:CN118711675B
公开(公告)日:2025-02-14
申请号:CN202411154210.6
申请日:2024-08-22
Applicant: 之江实验室
IPC: G16B40/00 , G16B20/00 , G06N3/042 , G06N3/0455 , G06N3/047 , G06N3/0475 , G06N3/088
Abstract: 本发明公开了一种基于变分图自编码器的基因量化表征方法和系统,方法包括以下步骤:根据蛋白质互作网络数据构建蛋白质互作网络有向图;根据基因本体论数据构建包括生物学过程树图、细胞成分树图和分子功能树图的三棵树图;分别计算三棵树图中根节点与目标基因的节点之间的非冗余最短路径作为目标基因的初级量化表征;将目标基因分别在三棵树图中的初级量化表征融合后再与蛋白质互作网络有向图结合,得到高级蛋白质互作网络有向图;将高级蛋白质互作网络有向图输入基于变分图自编码器的图神经网络模型中实现基因高级量化表征。本发明基于PPI、GO和变分图自编码器实现了单细胞基因的高效量化表征,为生物医学研究提供了深度和精度。
-
公开(公告)号:CN119517171B
公开(公告)日:2025-04-29
申请号:CN202510081736.4
申请日:2025-01-20
Applicant: 之江实验室
Abstract: 本发明公开了一种功能蛋白质挖掘和筛选方法及装置,将蛋白结构预测、蛋白质功能注释、蛋白簇挖掘等多维度的生物信息学分析与基于蛋白质大语言的人工智能方法结合起来,构建了一个针对功能蛋白的挖掘和筛选的流程。引入蛋白质的结构分析,利用蛋白质结构与功能的关联,通过构建结构相似性图谱,发掘功能相近的蛋白。蛋白质大语言模型能够包含蛋白结构,翻译后修饰和生物物理学特性等与蛋白质功能相关的特征参数,并以向量矩阵的形式揭示蛋白内在的功能关联性。通过引入这两种分析手段,并结合传统的基于序列的蛋白质功能注释的方法,使得序列相似性和亲缘度更低,但是拥有相应功能的蛋白被挖掘和筛选出来,从而能够更加高效精准地利用生物大分子。
-
-
-