用于蛋白质序列生成的离散图概率去噪扩散模型

    公开(公告)号:CN116994642A

    公开(公告)日:2023-11-03

    申请号:CN202310995978.5

    申请日:2023-08-09

    Abstract: 本发明公开了用于蛋白质序列生成的离散图概率去噪扩散模型,给定的蛋白质骨架指导相应氨基酸残基类型的扩散过程。该模型推断出氨基酸的联合分布,条件是节点的生物物理特性和局部环境。此外,本发明利用氨基酸替换矩阵进行扩散前向过程,编码氨基酸的生物学意义先验知识,包括它们的空间和序列邻居以及自身,从而减少了生成过程的采样空间。本发明的模型在序列恢复方面取得了业界领先的性能,并在生成确定蛋白质骨架结构的多样性蛋白质序列方面表现出巨大潜力。

Patent Agency Ranking