-
公开(公告)号:CN114360662B
公开(公告)日:2024-11-05
申请号:CN202111569573.2
申请日:2021-12-21
Applicant: 武汉大学
Abstract: 本发明提供了一种基于两路多分支CNN的单步逆合成方法及系统,其中的方法在进行单步逆合成预测时,输入待预测分子的SMILES序列,经过两路多分支卷积层,特征拼接层,全连接层后,输出反应规则集能产生该分子的前k条反应规则。根据输出的反应规则,结合待预测分子的SMILES,最终计算得到目标分子的反应物SMILES,实现单步逆合成自动化。本实施例还提出一种基于两路多分支CNN的单步逆合成系统,通过反应数据集获取,训练集构造,模型构建,模型训练,单步逆合成预测以及结果可视化等模块处理过程,实现了目标分子的单步逆合成自动化。本发明成果既可用于化学逆合成领域,也可用于生物逆合成领域,具有比现有方法更广泛的用途。
-
公开(公告)号:CN114496105B
公开(公告)日:2024-08-23
申请号:CN202210080029.X
申请日:2022-01-24
Applicant: 武汉大学
Abstract: 本发明提供了一种基于多语义网络的单步逆合成方法及系统,在进行单步逆合成预测的时,输入目标产物分子的ECFP4特征和SMILES词单热特征,经过多语义网络之后,以反应模板的形式输出该目标产物分子上可能发生的前k条反应。根据输出的反应模板,结合目标产物分子的SMILES字符串,最终计算得到目标产物分子所对应的反应物的SMILES字符串,实现单步逆合成预测。本发明是单步逆合成领域中第一个使用多语义融合网络来进行单步逆合成预测的,是基于模板的单步逆合成方法,预测结果具有较强的可解释性。网络除了对融合语义特征学习之外,还分别对ECFP4语义特征和SMILES词单热语义特征学习,从而增强了融合语义特征对分子的表达能力,进而提高了网络的预测结果精度。
-
公开(公告)号:CN115762663A
公开(公告)日:2023-03-07
申请号:CN202211432147.9
申请日:2022-11-16
Applicant: 武汉大学
Abstract: 本发明公开了一种基于通量平衡分析的代谢网络关键因子挖掘方法。该方法不需要复杂的领域知识,通过输入代谢网络以及目标化合物,可以直接挖掘对目标化合物影响最大的多个反应,用于快速辅助生物学家优化的代谢网络。本发明首先对已有代谢网络进行建模,并且确定需要生产的目标产物,并依据FBA对代谢网络中可以产生目标产物的反应进行分析,进而使用基于遗传算法的最大通量变化计算方法来计算每个反应对目标代谢物通量对影响,并依次确定对通量影响最大的top‑k个代谢反应作为关键因子。本发明为代谢途径设计和优化提供了候选的关键因子。
-
公开(公告)号:CN114496105A
公开(公告)日:2022-05-13
申请号:CN202210080029.X
申请日:2022-01-24
Applicant: 武汉大学
Abstract: 本发明提供了一种基于多语义网络的单步逆合成方法及系统,在进行单步逆合成预测的时,输入目标产物分子的ECFP4特征和SMILES词单热特征,经过多语义网络之后,以反应模板的形式输出该目标产物分子上可能发生的前k条反应。根据输出的反应模板,结合目标产物分子的SMILES字符串,最终计算得到目标产物分子所对应的反应物的SMILES字符串,实现单步逆合成预测。本发明是单步逆合成领域中第一个使用多语义融合网络来进行单步逆合成预测的,是基于模板的单步逆合成方法,预测结果具有较强的可解释性。网络除了对融合语义特征学习之外,还分别对ECFP4语义特征和SMILES词单热语义特征学习,从而增强了融合语义特征对分子的表达能力,进而提高了网络的预测结果精度。
-
公开(公告)号:CN118711672A
公开(公告)日:2024-09-27
申请号:CN202410802421.X
申请日:2024-06-20
Applicant: 武汉大学
IPC: G16B40/00 , G16B50/10 , G06N3/042 , G06N3/0464 , G06N3/0455 , G06N3/084
Abstract: 本发明提出了一种基于拓扑感知注意力网络的蛋白质功能预测方法及装置,其中的方法包括如下步骤S1:获取公开蛋白质功能注释数据集、公开的描述基因本体及关系obo文件;S2:构建蛋白质图输入和基因本体图输入;S3:搭建基于拓扑感知的蛋白质‑基因本体论注意力网络,其中包括拓扑感知的注意力模块和多头聚合器;S4:利用步骤S1中的数据对步骤S3中的拓扑感知的蛋白质‑基因本体注意力网络进行训练,得到训练好的蛋白质功能预测模型。S5:对待一个待预测功能的蛋白质,利用步骤S5中的训练好的模型生成其被每一个GO术语注释的概率。通过本发明的方法可以提升蛋白质功能预测的效果。
-
公开(公告)号:CN114360662A
公开(公告)日:2022-04-15
申请号:CN202111569573.2
申请日:2021-12-21
Applicant: 武汉大学
Abstract: 本发明提供了一种基于两路多分支CNN的单步逆合成方法及系统,其中的方法在进行单步逆合成预测时,输入待预测分子的SMILES序列,经过两路多分支卷积层,特征拼接层,全连接层后,输出反应规则集能产生该分子的前k条反应规则。根据输出的反应规则,结合待预测分子的SMILES,最终计算得到目标分子的反应物SMILES,实现单步逆合成自动化。本实施例还提出一种基于两路多分支CNN的单步逆合成系统,通过反应数据集获取,训练集构造,模型构建,模型训练,单步逆合成预测以及结果可视化等模块处理过程,实现了目标分子的单步逆合成自动化。本发明成果既可用于化学逆合成领域,也可用于生物逆合成领域,具有比现有方法更广泛的用途。
-
-
-
-
-