一种基于沃罗诺伊图的蛋白质复合物模型质量评估方法

    公开(公告)号:CN119132385A

    公开(公告)日:2024-12-13

    申请号:CN202411021560.5

    申请日:2024-07-29

    Abstract: 一种基于沃罗诺伊图的蛋白质复合物模型质量评估方法,首先在PDB结构数据库中通过PISCES服务器筛选出7099个结构;然后采用结构扰动、模板建模和深度学习建模三种方法为数据集中的每个蛋白质生成大约150个结构模型。每个结构模型对氨基酸序列、蛋白质模型结构提取接触面面积,溶剂可及面积,基于接触面的能量项,残基级接触面方向等基于沃罗诺伊图的特征以及提取罗塞塔特征和语言模型特征之后,由不变点注意力机制神经网络模块捕获不同尺度的特征集合,由残差注意力神经网络解码输出逐残基的lDDT分数。本发明能够快速和有针对性的进行蛋白质复合物模型质量评估,有效解决蛋白质复合物模型质量评估精度低、可靠性差的问题。

    一种基于多种群协同进化的车辆路径优化方法

    公开(公告)号:CN112132317A

    公开(公告)日:2020-12-25

    申请号:CN202010849330.3

    申请日:2020-08-21

    Abstract: 一种基于多种群协同进化的车辆路径优化方法,首先,创建研究区域的网络数据集,获取研究对象点之间的距离成本矩阵;然后客户点进行自然数编码,并完成多种群的初始化;对种群中的染色体进行交叉、变异操作,再进行每个子种群间的染色体替换,实现多种群的协同进化,重复交叉、变异和协同进化选择操作,直到满足迭代的终止条件;最终,输出种群中适应度最高的染色体,完成解码操作后,即可得到车辆调度的最优路径方案。本发明提供一种更加贴合实际应用的基于多种群协同进化的车辆路径优化方法。

    一种采用渐近式搜索MSA的蛋白质系综预测方法

    公开(公告)号:CN119964645A

    公开(公告)日:2025-05-09

    申请号:CN202510048792.8

    申请日:2025-01-13

    Abstract: 一种采用渐近式搜索MSA的蛋白质系综预测方法,首先,给定目标蛋白质序列,使用MMSeqs生成MSA。然后,使用DBSCAN方法对每个MSA进行聚类,生成多个子MSA;对于聚类失败的MSA,采用高斯混合模型(GMM)进行期望最大化(EM)聚类;接着,使用BLAST序列比对方法,从每个子MSA中选出相似度最高的序列,再次利用MMSeqs生成新的MSA,将所有子MSA合并为一个新的MSA,去除完全相同的序列,并对长度不一致的序列使用MAFFT添加GAP;处理后的MSA再次聚类,最终输入AlphaFold2生成蛋白质系综。本发明有效利用MSA共进化信息以预测蛋白质动态系综。

    一种基于多目标优化的多域蛋白质组装方法

    公开(公告)号:CN118571313A

    公开(公告)日:2024-08-30

    申请号:CN202410688218.4

    申请日:2024-05-30

    Abstract: 一种基于多目标优化的多域蛋白质组装方法,通过AlphaFold2获取的单域结构构建初始全链构象种群,随后对构象的域间二面角执行交叉变异操作生成新的构象;其次,使用AlphaFold2获取全链距离特征,并结合DeepAssembly预测域间方位信息,构建两个能量函数;最后,设计多目标优化算法,从构象空间中获取非支配解集以更新种群;经过设定次数的循环迭代,包括交叉变异、构象采样和种群更新操作,获得最终构象集;接着,利用模型质量评估技术对这些构象进行挑选。本发明为结构建模提供丰富的信息;为高精度蛋白质结构提供了更高质量的构象集。

    一种基于多残基间距离图约束的蛋白质结构预测方法

    公开(公告)号:CN114530194A

    公开(公告)日:2022-05-24

    申请号:CN202210185769.X

    申请日:2022-02-28

    Abstract: 一种基于多残基间距离图约束的蛋白质结构预测方法,首先由trRosetta、RaptorX、LOMETS三个蛋白质残基间距离预测服务器获得三个残基间距离文件以构建三张残基间距离图从来构建基于残基间距离的评分函数;其次循环Rosetta第一、第二阶段以生成初始种群,然后在种群中选择目标构象并对其进行交叉变异以生成测试构象,并通过Rosetta score3概率接收测试构象,以增加种群中构象多样性;然后通过聚类找出符合标准的构象以缩小种群规模,增加算法效率;最后根据三个残基间距离图构建的评分函数来更新种群中的构象,得到最接近天然构象的最优构象。本发明预测效率和预测精度较高。

    一种基于残基接触图信息博弈机制的蛋白质结构预测方法

    公开(公告)号:CN113257338A

    公开(公告)日:2021-08-13

    申请号:CN202110440653.1

    申请日:2021-04-23

    Abstract: 一种基于残基接触图信息博弈机制的蛋白质结构预测方法,首先,通过根据CASP比赛Jaccard指标选择的RaptorX、ResPRE、NeBcon、DeepMetaPSICOV四个蛋白质残基接触服务器,获取多张残基接触图从而构建多个能量函数;其次,利用Rosetta第一、第二阶段对种群初始化,然后通过对目标构象进行变异、交叉生成新的测试构象;最后,根据四个残基接触图构建的能量函数,设计基于Pareto的多目标优化算法来对构象进行更新,从而引导算法采样得到结构更接近天然态的构象。本发明提供一种基于残基接触图信息博弈机制的蛋白质结构预测方法。

    一种基于宏基因组的蛋白质多序列比对方法

    公开(公告)号:CN113257337A

    公开(公告)日:2021-08-13

    申请号:CN202110433567.8

    申请日:2021-04-20

    Abstract: 一种基于宏基因组的蛋白质多序列比对方法,根据目标蛋白的序列,使用HHblits对UniClust30数据库进行初始搜索,过滤掉搜索的MSA中残基空位符超过目标序列长度50%的序列,搜索过程的迭代3次;对获得的多序列比对文件使用hhfilter过滤生成的MSA中gap占比超过25%的序列,得到MSA1;计算MSA1的有效序列数Meff,若Meff≥10L,结束搜索,将MSA1作为多序列比对的输出结果;否则,构建MSA1的隐马尔可夫模型HMM,搜索Metaclust50宏基因组数据库,得到多重序列比对MSA2,将MSA1与MSA2合并,得到最终MSA。本发明不仅增强了搜索同源序列的数量及质量,而且提高了计算效率。

    一种基于深度图卷积网络的计算蛋白质设计方法

    公开(公告)号:CN116312753A

    公开(公告)日:2023-06-23

    申请号:CN202310251057.8

    申请日:2023-03-08

    Abstract: 一种基于深度图卷积网络的计算蛋白质设计方法,通过GeoVP模块结合图神经网络和卷积神经网络,可利用图神经网络优秀的结构、关系表示能力和卷积神经网络优秀的信息富集能力,将蛋白质的主链原子之间的距离、方位和方向特征以及蛋白质整体的拓扑特征转化为图作为输入,使得由深度图卷积网络构成的生成模型能充分地捕获到氨基酸残基和蛋白质三维结构之间的对应关系。同时,采用有偏温度调整分布采样,结合预测序列先验信息,既简化了采样空间,又能获得比天然的可能性更高的序列;本发明提高了采样效率和采样能力,从而提升预测精度。

    一种基于深度残差网络的蛋白质残基间距离分布预测方法

    公开(公告)号:CN113257341A

    公开(公告)日:2021-08-13

    申请号:CN202110483806.0

    申请日:2021-04-30

    Abstract: 一种基于深度残差网络的蛋白质残基间距离分布预测方法,首先构建数据集,制作标签数据,获取多序列比对文件,以序列相似度为60%提取多序列比对文件;对20种氨基酸类型和gap进行编码;按照随机分配三张残基接触图权重合成一张新的接触图特征;搭建深度残差神经网络模型,将提取出的特征信息维度规范化处理,合并成一个491维L*L大小的输入特征;输入到深度残差网络模型中,经过数据降维,特征提取和反向传播参数,迭代50次后获得训练模型;将待测的蛋白质序列和特征信息输入到训练的模型中得到残基间的距离在每个距离区间的概率;本发明提供了一种基于深度残差网络的蛋白质残基间距离分布预测方法。

Patent Agency Ranking