基于迁移学习的多肽与主要组织相容性复合物类蛋白分子结合预测方法

    公开(公告)号:CN115588462A

    公开(公告)日:2023-01-10

    申请号:CN202211121535.5

    申请日:2022-09-15

    Abstract: 本发明涉及基于迁移学习的预测方法,属于大数据分析技术领域,本发明为了解决现有的肽和主要组织相容性复合物结合请合理算法准确性和特异性,相对实际应用有待改进的问题。本发明通过如下步骤实现的:步骤一、对pepRoBERTa训练层进行预训练;步骤二、通过softmax激活函数获得概率分布,获得模型的序列特征;步骤三、对步骤二中得到的模型进行微调;步骤四、对步骤三中微调后的模型进行嵌入并通过RoBERTa训练层和输出层得出结果。本发明不仅利用了肽和MHCI类蛋白结合亲和力数据,并融合了无标签蛋白的序列特征。

Patent Agency Ranking