蛋白质稳定性预测方法、装置、计算机设备及存储介质

    公开(公告)号:CN119360981A

    公开(公告)日:2025-01-24

    申请号:CN202411375114.4

    申请日:2024-09-29

    Abstract: 本申请实施例提供了一种蛋白质稳定性预测方法、装置、计算机设备及存储介质。方法包括:获取原始型蛋白质对应的第一待测序列与对应的突变型蛋白质的第二待测序列;根据蛋白质语言模型的注意力机制从第一待测序列中确定多个第一目标残基特征并对其进行全局特征的提取,得到第一虚拟结构微环境特征;同理,得到多个第二目标残基特征对应的第二虚拟结构微环境特征;基于第一虚拟结构微环境特征和第二虚拟结构微环境特征确定第一差值,并基于第一待测序列对应的第一全局序列特征和第二待测序列对应的第二全局序列特征确定第二差值;根据第一差值和第二差值进行预测,得到蛋白质稳定性预测结果。以此,能够提高对蛋白质的稳定性进行预测的准确性。

    多肽序列构建方法和装置、设备及存储介质

    公开(公告)号:CN117497054A

    公开(公告)日:2024-02-02

    申请号:CN202311394977.1

    申请日:2023-10-25

    Abstract: 本申请实施例提供了一种多肽序列构建方法和装置、设备及存储介质,属于生物信息技术领域。该方法包括:获取包含具备靶向信息和预设性质信息的多肽训练序列的蛋白质训练数据集;根据多肽训练序列对预设的原始多肽序列预测模型进行模型参数微调得到目标多肽序列预测模型;获取包括参考多肽序列的参考多肽序列集;通过目标多肽序列预测模型对参考多肽序列进行序列预测得到多肽预测序列;根据参考多肽序列和多肽预测序列组合形成候选多肽序列;对候选多肽序列进行结构预测得到多肽结构信息;根据预设的筛选条件和多肽结构信息对候选多肽序列进行筛选处理得到目标多肽序列。本申请实施例能够生成方向性且质量更高的多肽序列。

    病毒性质预测模型训练方法和病毒性质预测方法

    公开(公告)号:CN117292756A

    公开(公告)日:2023-12-26

    申请号:CN202311136170.8

    申请日:2023-09-01

    Abstract: 本申请实施例提供了病毒性质预测模型训练方法和病毒性质预测方法,通过由病毒蛋白质序列数据集提取的特征训练预测模型得到目标预测模型;在训练模型的过程中,根据第一模型预测结果、回归标签和第一惩罚指数得到回归任务的回归损失函数值,根据第二模型预测结果、分类标签、第二惩罚指数和权重系数得到分类任务的分类损失函数值,根据回归损失函数值和分类损失函数值调整模型参数,通过第一惩罚指数指导对回归任务中的负样本的惩罚程度,通过第二惩罚指数指导对分类任务中的负样本的惩罚程度,通过权重系数调整分类损失函数对于分类任务的正样本的注重程度,从而解决训练数据正负样本不平衡问题。

    高风险变异毒株预测方法、电子设备及存储介质

    公开(公告)号:CN117577188A

    公开(公告)日:2024-02-20

    申请号:CN202311131474.5

    申请日:2023-09-01

    Abstract: 本申请提出一种高风险变异毒株预测方法、电子设备和存储介质。方法通过从预设的毒株序列数据集中提取第一毒株序列以及由第一毒株序列变异得到的所有第二毒株序列,根据第一毒株序列和所有第二毒株序列确定毒株的突变数量倍率、每个位点的突变频率以及残基分布;根据起始毒株序列、突变数量倍率、突变频率和残基分布生成预测毒株序列;根据多个预设指标对预测毒株序列进行高通量筛选,得到目标毒株序列,最后根据湿实验结果从目标毒株序列中筛选高风险变异株。应用本申请能基于毒株的变异趋势预测生成预测毒株序列,再根据各项预设指标筛选出目标毒株序列,再通过湿实验验证毒株在真实环境中的各项性质,从而准确地预测出高风险变异毒株。

    基于语言模型的抗病毒多肽序列设计方法

    公开(公告)号:CN117393047A

    公开(公告)日:2024-01-12

    申请号:CN202311155326.7

    申请日:2023-09-07

    Abstract: 本申请涉及蛋白质多肽设计技术领域,提供了一种基于语言模型的抗病毒多肽序列设计方法,该利用目标病毒在病毒分类体系中所属更高类别的病毒的多肽序列进行分层筛选,即利用适用于对抗第一类别的病毒的多肽序列训练语言模型,以使语言模型能够按照适用于对抗第一类别的病毒的多肽序列生成候选多肽序列,同时利用适用于对抗第二类别的病毒的多肽序列训练多肽序列分类模型,以使多肽序列分类模型能够筛选出适用于对抗第二类别的候选多肽序列,最后利用适用于对抗目标病毒的多肽序列从序列相似度层面筛选候选多肽序列,将自然语言处理技术迁移到蛋白质工程领域通过分层式筛选不断缩小目标多肽序列的范围,降低抗病毒多肽序列的设计时间和资金成本。

    抗体与抗原之间相互作用的预测方法以及相关设备

    公开(公告)号:CN119314547A

    公开(公告)日:2025-01-14

    申请号:CN202411358103.5

    申请日:2024-09-27

    Abstract: 本申请实施例提供了一种抗体与抗原之间相互作用的预测方法以及相关设备,属于数据处理技术领域。该方法包括:获取目标抗体的抗体序列信息和目标抗原的抗原序列信息;提取抗体序列信息中的抗体序列特征,以及提取抗原序列信息中的抗原序列特征;确定抗体序列特征和抗原序列特征之间各自的双向注意力权重,并基于各个双向注意力权重提取抗体序列特征和抗原序列特征之间的双向注意力特征;将抗体序列特征映射到目标抗体的空间结构上,得到抗体结构特征;融合双向注意力特征和抗体结构特征得到目标特征,并基于目标特征确定目标抗体与目标抗原之间相互作用的目标预测结果。本申请能够提高对目标抗体与目标抗原之间相互作用的预测准确度。

Patent Agency Ranking