-
公开(公告)号:CN119517171B
公开(公告)日:2025-04-29
申请号:CN202510081736.4
申请日:2025-01-20
Applicant: 之江实验室
Abstract: 本发明公开了一种功能蛋白质挖掘和筛选方法及装置,将蛋白结构预测、蛋白质功能注释、蛋白簇挖掘等多维度的生物信息学分析与基于蛋白质大语言的人工智能方法结合起来,构建了一个针对功能蛋白的挖掘和筛选的流程。引入蛋白质的结构分析,利用蛋白质结构与功能的关联,通过构建结构相似性图谱,发掘功能相近的蛋白。蛋白质大语言模型能够包含蛋白结构,翻译后修饰和生物物理学特性等与蛋白质功能相关的特征参数,并以向量矩阵的形式揭示蛋白内在的功能关联性。通过引入这两种分析手段,并结合传统的基于序列的蛋白质功能注释的方法,使得序列相似性和亲缘度更低,但是拥有相应功能的蛋白被挖掘和筛选出来,从而能够更加高效精准地利用生物大分子。
-
公开(公告)号:CN119517171A
公开(公告)日:2025-02-25
申请号:CN202510081736.4
申请日:2025-01-20
Applicant: 之江实验室
Abstract: 本发明公开了一种功能蛋白质挖掘和筛选方法及装置,将蛋白结构预测、蛋白质功能注释、蛋白簇挖掘等多维度的生物信息学分析与基于蛋白质大语言的人工智能方法结合起来,构建了一个针对功能蛋白的挖掘和筛选的流程。引入蛋白质的结构分析,利用蛋白质结构与功能的关联,通过构建结构相似性图谱,发掘功能相近的蛋白。蛋白质大语言模型能够包含蛋白结构,翻译后修饰和生物物理学特性等与蛋白质功能相关的特征参数,并以向量矩阵的形式揭示蛋白内在的功能关联性。通过引入这两种分析手段,并结合传统的基于序列的蛋白质功能注释的方法,使得序列相似性和亲缘度更低,但是拥有相应功能的蛋白被挖掘和筛选出来,从而能够更加高效精准地利用生物大分子。
-