基于蛋白质工程的集成序列与结构特征的深度学习模型及预测方法

    公开(公告)号:CN115954050A

    公开(公告)日:2023-04-11

    申请号:CN202211209310.5

    申请日:2022-09-30

    Inventor: 洪亮 谈攀 李明辰

    Abstract: 本发明公开了一种基于蛋白质工程的集成序列与结构特征的深度学习模型及预测方法,本发明先建立了整合序列和结构信息来预测蛋白质突变效果的深度学习模型。然后结合特定的数据增强策略,以减少深度学习模型对实验样本量的依赖程度。具体是大量来自无监督模型的低质量预测结果会首先被用来对深度学习模型进行预训练,之后对于有实验结果的则用有限数量的高品质实验结果会被用来对模型进行微调。实验表明当后续微调的实验数据量小于40或没有任何实验数据时,仅经过预训练得到的深度学习模型可以在预测高阶突变效果的任务上取得非常高的精度。

Patent Agency Ranking