基于多任务预训练逆强化学习的三维空间分子生成方法和装置

    公开(公告)号:CN115831261A

    公开(公告)日:2023-03-21

    申请号:CN202211426292.6

    申请日:2022-11-14

    Abstract: 本发明公开了一种基于多任务预训练逆强化学习的三维空间分子生成方法和装置,采用最小张成树算法依据化学分子构建真实分子生成序列;采用策略网络依据当前分子中间产物生成添加原子动作,以构建预测分子生成序列;以真实分子生成序列和基于策略网络生成的预测分子生成序列同时输入预训练的Transformer模型,基于Transformer模型的回归预测来构建奖励函数,通过奖励函数来训练策略网络,提高策略网络的预测鲁棒性,另外,在构建奖励函数时使真实样本的奖励值最大化且预测样本的奖励值最小化,优化时,智能体采取和专家行为类似的动作,缓解了奖励稀疏的问题,同时提升了参数优化效率。

    一种基于狄利克雷过程的持续元学习方法和装置

    公开(公告)号:CN115713117A

    公开(公告)日:2023-02-24

    申请号:CN202211484021.6

    申请日:2022-11-24

    Abstract: 本发明公开了一种基于狄利克雷过程的持续元学习方法和装置,包括:构建至少1个独立的元知识分布作为初始元知识分布;缓存当前时刻顺序到达的数据,基于初始元知识分布利用狄利克雷过程动态为当前时刻的数据增加新元知识分布的个数,并随机初始化新元知识分布;通过贝叶斯持续学习方法,将前一时刻元知识分布的后验作为当前时刻元知识分布的先验,根据贝叶斯法则在缓存的数据流中进行元知识分布的迭代更新,其中,元知识分布包括初始元知识分布和每时刻增加的新元知识分布;构建更新的元知识分布与目标任务的对应关系,依据对应关系为目标任务的对应模型进行元知识的初始化,然后利用少量带标签数据对模型进行学习,得到能够实现预测的模型。

    基于氨基酸知识图谱和主动学习的蛋白质改造方法

    公开(公告)号:CN114678060B

    公开(公告)日:2025-04-29

    申请号:CN202210121706.8

    申请日:2022-02-09

    Abstract: 本发明公开了一种基于氨基酸知识图谱和主动学习的蛋白质改造方法,包括:基于氨基酸的生化属性构建氨基酸知识图谱;结合氨基酸知识图谱对蛋白质数据进行数据增强,得到蛋白质增强数据并进行表示学习,得到第一蛋白质增强表示;利用预训练蛋白质模型对蛋白质数据,或蛋白质数据和氨基酸知识图谱进行表示学习,得到第二蛋白质增强表示;综合第一蛋白质增强表示和第二蛋白质增强表示,得到蛋白质增强表示;以蛋白质增强表示作为样本,采用主动学习从样本中筛选代表性样本并进行蛋白质性质的人工标注,利用人工标注的代表性样本训练蛋白质性质预测模型;利用蛋白质性质预测模型进行蛋白质改造,能够实现对蛋白质的快速准确改造。

    基于氨基酸知识图谱和主动学习的蛋白质改造方法

    公开(公告)号:CN114678060A

    公开(公告)日:2022-06-28

    申请号:CN202210121706.8

    申请日:2022-02-09

    Abstract: 本发明公开了一种基于氨基酸知识图谱和主动学习的蛋白质改造方法,包括:基于氨基酸的生化属性构建氨基酸知识图谱;结合氨基酸知识图谱对蛋白质数据进行数据增强,得到蛋白质增强数据并进行表示学习,得到第一蛋白质增强表示;利用预训练蛋白质模型对蛋白质数据,或蛋白质数据和氨基酸知识图谱进行表示学习,得到第二蛋白质增强表示;综合第一蛋白质增强表示和第二蛋白质增强表示,得到蛋白质增强表示;以蛋白质增强表示作为样本,采用主动学习从样本中筛选代表性样本并进行蛋白质性质的人工标注,利用人工标注的代表性样本训练蛋白质性质预测模型;利用蛋白质性质预测模型进行蛋白质改造,能够实现对蛋白质的快速准确改造。

    基于Transformer的上下文感知单步逆合成预测方法和装置

    公开(公告)号:CN115798621A

    公开(公告)日:2023-03-14

    申请号:CN202211467767.6

    申请日:2022-11-22

    Abstract: 本发明公开了一种基于Transformer的上下文感知单步逆合成预测方法和装置,包括:在合成路径搜索树中搜索从目标分子到选定分子的上下文路径;编码上下文路径中化学反应模板相关的上下文分子信息以得到获取上下文反应表征向量序列,同时编码选定分子以得到选定分子的深层次语义特征向量;利用Transformer模型对上下文反应表征向量序列与深层次语义特征向量的拼接结果进行编码,以得到融合上下文信息的分子表征向量;利用分类器对分子表征向量进行候选化学反应模板预测,依据化学反应模板预测结果筛选排序高的候选化学反应模板应用于选定分子到目标分子的单步逆合成。该方法和装置提升分子化学反应模板预测的准确性。

Patent Agency Ranking