一种基于哈希学习的药物虚拟筛选方法

    公开(公告)号:CN118866167A

    公开(公告)日:2024-10-29

    申请号:CN202411000281.0

    申请日:2024-07-24

    Applicant: 南京大学

    Inventor: 李武军 韩进 洪运

    Abstract: 本发明公开一种基于哈希学习的药物虚拟筛选方法:首先获取蛋白质‑分子复合物数据集;分别定义蛋白质和分子编码器;定义对比学习目标函数,学习蛋白质和分子的相似性信息;定义多模态哈希目标函数,学习蛋白质和分子的二值向量;将对比学习和多模态哈希目标函数构成最终损失函数,训练模型。将分子数据库中的分子表示成二值向量。在进行药物虚拟筛选时,将蛋白质靶标表示为二值向量。计算蛋白质靶标的二值向量和分子数据库中二值向量之间海明距离,或是通过二值向量数据库构建倒排索引来检索最可能结合的分子。根据实际需求,选取一定比例的分子作为候选药物分子。本发明提升了药物虚拟筛选的精度,减少了存储开销,提升了检索速度。

Patent Agency Ranking