-
公开(公告)号:CN117577192A
公开(公告)日:2024-02-20
申请号:CN202311602506.5
申请日:2023-11-28
Applicant: 复旦大学
IPC: G16B40/00 , G16B50/00 , G16B35/00 , G06N3/0455 , G06N3/0895
Abstract: 本发明属于深度学习与药物设计领域,涉及一种针对蛋白质表示学习的自监督预训练方法。本发明基于自监督预训练技术对蛋白质的几何特征和化学特征表示学习,包括:步骤S1,对来自蛋白质数据库的无标注蛋白质数据进行预处理,使用点云建模蛋白质表面,形成无标注蛋白质表面点云数据集;步骤S2:基于掩码重建代理任务,使用S1得到的数据进行自监督预训练,在无标注蛋白质表面点云数据集上预训练网络;步骤S3:使用预训练网络的编码器作为初始化,在下游任务上微调深度网络。本发明方法着重针对于蛋白质的三维结构表示学习,能够使用大量无标注的蛋白质数据提升网络在下游任务上的表现,从而减少对蛋白质有标注数据的需求,降低标注成本。