-
公开(公告)号:CN118866167A
公开(公告)日:2024-10-29
申请号:CN202411000281.0
申请日:2024-07-24
Applicant: 南京大学
Abstract: 本发明公开一种基于哈希学习的药物虚拟筛选方法:首先获取蛋白质‑分子复合物数据集;分别定义蛋白质和分子编码器;定义对比学习目标函数,学习蛋白质和分子的相似性信息;定义多模态哈希目标函数,学习蛋白质和分子的二值向量;将对比学习和多模态哈希目标函数构成最终损失函数,训练模型。将分子数据库中的分子表示成二值向量。在进行药物虚拟筛选时,将蛋白质靶标表示为二值向量。计算蛋白质靶标的二值向量和分子数据库中二值向量之间海明距离,或是通过二值向量数据库构建倒排索引来检索最可能结合的分子。根据实际需求,选取一定比例的分子作为候选药物分子。本发明提升了药物虚拟筛选的精度,减少了存储开销,提升了检索速度。