-
公开(公告)号:CN117995266A
公开(公告)日:2024-05-07
申请号:CN202410206560.6
申请日:2024-02-26
Applicant: 湖南大学
Abstract: 本发明公开了一种基于三重特征增强表征的药物靶标相互作用预测方法,首先提取出待预测药物靶标对数据中药物和靶标的功能子结构,再对药物靶标对数据构建药物‑靶标相互作用对网络,然后构建三重特征学习模块,使用两个Transformer编码器和图神经网络分别对药物、靶标和药物‑靶标相互作用对网络进行特征学习,最后将特征融合后得到三重特征增强表征的药物靶标对表示输入分类器中得到预测结果。本方法在学习药物和靶标个体特征的基础上,增加了药物靶标对网络特征以生成增强表征,在挖掘药物分子中原子信息和靶标氨基酸序列残基信息之外,关注了药物‑靶标相互作用对网络可能提供的潜在直接关联信息。本发明可以有效学习获取药物靶标相互作用的功能性特征。
-
公开(公告)号:CN116738850A
公开(公告)日:2023-09-12
申请号:CN202310719091.3
申请日:2023-06-16
Applicant: 湖南大学
IPC: G06F30/27 , G06F18/2321 , G06F18/2135 , G06F18/22 , G06F17/16 , G06F111/06
Abstract: 本发明公开了一种基于迁移学习的连续多模态多目标优化方法,包括以下步骤:S1、在决策空间中,通过随机初始化N个个体形成初始种群Pop;S2、从种群Pop中选取具有良好收敛性和多样性的解,并将其存储到档案集Archive中;S3、第一阶段,使用二元锦标赛方法生成父代,并通过模拟二进制交叉和多项式变异产生子代;S4、第二阶段,使用采样测地线流方法获取迁移解作为子代;S5、根据生成的子代,更新种群Pop和档案集Archive,直到达到设定的最大迭代次数maxGen,然后输出结果。本发明能够找到决策空间中多个帕累托最优解集,提高搜索效率,并保持决策空间和目标空间收敛性和多样性的平衡。
-
公开(公告)号:CN117894398A
公开(公告)日:2024-04-16
申请号:CN202311849091.1
申请日:2023-12-29
Applicant: 湖南大学
IPC: G16C20/50 , G16C20/70 , G06N3/0455 , G06N3/0475 , G06N3/042 , G06N3/08 , G06F21/62
Abstract: 本发明公开了一种基于扩散模型的分子优化方法,包括:获取多个分子,每个分子具有一个DRD2值,将DRD2值小于0.05的所有分子构建为第一分子集合,将DRD2值大于0.5的所有分子构建为第二分子集合,并对第一分子集合和第二分子集合进行预处理,以分别得到更新后的第一分子集合和第二分子集合,并分别从第一分子集合和第二分子集合中提取每个分子的信息,第一和第二分子集合中所有分子的信息分别构成第一和第二分子信息集合,将预处理后的第一分子信息集合输入预先训练好的分子优化模型中,以得到该第一分子信息集合所对应的每个分子的分子优化结果。本发明能够解决现有基于RNN的分子优化方法由于没有实现对数据的加密,因此会导致数据泄露的技术问题。
-
公开(公告)号:CN117727374A
公开(公告)日:2024-03-19
申请号:CN202311566929.6
申请日:2023-11-23
Applicant: 湖南大学
Abstract: 本发明公开了一种基于扩散模型的多目标分子生成方法,包括:获取带有标签的活性分子数据集,将活性分子数据集输入到预先建立好的子结构搜索模型,以获取活性分子数据集的语义子结构S,将语义子结构转换成含噪语义子结构简化分子线性输入规范SMILES序列ynoise,并将该含噪语义子结构SMILES序列ynoise进一步转换为含噪语义子结构词元y0,将含噪语义子结构序列y0输入预先训练好的扩散模型,以获取多目标分子。本发明能够解决现有基于生成对抗网络的模型虽然能够生成看似高质量的样本,但是其难以训练,而且训练容易坍缩,从而导致生成样本唯一性很差的技术问题。
-
公开(公告)号:CN116030908A
公开(公告)日:2023-04-28
申请号:CN202310149714.8
申请日:2023-02-22
Applicant: 湖南大学
IPC: G16C20/50 , G16C20/70 , G06N3/047 , G06N3/044 , G06N3/048 , G06N3/0464 , G06N3/08 , G06N3/094 , G06N3/0475
Abstract: 本发明公开了一种抗癌肽生成模型的训练方法,包括:获取一般多肽序列数据、抗癌肽序列数据和非抗癌肽序列数据,并根据氨基酸词表对一般多肽序列数据、抗癌肽序列数据和非抗癌肽序列数据进行数字编码,以得到一般多肽序列数据集、抗癌肽序列数据集和非抗癌肽序列数据集,将一般多肽序列数据集、抗癌肽序列数据集和非抗癌肽序列数据集分别按照训练集和测试集8:2的比例进行划分,以得到一般多肽序列训练集和测试集、抗癌肽序列训练集和测试集和非抗癌肽序列训练集和测试集,将一般多肽序列训练集输入抗癌肽生成模型的生成模块中,并使用反向传播算法对生成模块中每层的权重参数和偏置参数进行更新和优化,以得到预训练好的生成模块。
-
-
-
-