-
公开(公告)号:CN119851776A
公开(公告)日:2025-04-18
申请号:CN202411898903.6
申请日:2024-12-23
Applicant: 上海交通大学医学院附属新华医院
Abstract: 本发明公开了一种基于深度学习的蛋白质设计方法,包括以下步骤:从五个预训练的模型中计算蛋白质序列中的氨基酸分布;然后分别计算五个预训练的模型中的蛋白质各氨基酸残基分布;接着将五个预训练的模型中的氨基酸分布进行合并到新的纬度,并将合并后的分布输入基于自注意力的集成网络中,并获得注意力输出Z;将注意力输出Z通过多层前馈神经网络进行处理并获得结果H;然后出线性层进行投射到并得到未归一化得分;接着将未归一化得分进行归一化得到最终的蛋白质序列分布。本发明提供了一种基于深度学习的蛋白质设计方法,通过整合多个预训练模型的结构,全面学习蛋白质结构序列模态对应关系,能够设计出更为多样性的蛋白质序列。