基于二维分子图的分子类药性无监督预测方法及装置

    公开(公告)号:CN118866166B

    公开(公告)日:2025-01-07

    申请号:CN202411372121.9

    申请日:2024-09-29

    Applicant: 厦门大学

    Abstract: 本申请提出了一种基于二维分子图的分子类药性无监督预测方法及装置,其中,该方法包括:首先,在大量包括类药和非类药分子的数据库ChEMBL上,通过原子掩码预测和化学键掩码预测的预训练任务训练教师模型,使其学到了和类药性高度相关的分子拓扑结构的特征;然后,仅在药物数据上蒸馏出一个与教师模型结构相同的学生模型;接着,将一个任意分子分别输入到教师模型和学生模型,并将两个模型输出的特征表示的差距作为这个任意分子的类药性分数;最后,根据类药性分数对这个任意分子的类药性进行预测,以得到预测结果;由此,通过训练好的教师模型和学生模型能够直接捕捉和类药性高度相关的分子特征,同时极大地缓解了一维序列模型的长度偏差问题。

    基于二维分子图的分子类药性无监督预测方法及装置

    公开(公告)号:CN118866166A

    公开(公告)日:2024-10-29

    申请号:CN202411372121.9

    申请日:2024-09-29

    Applicant: 厦门大学

    Abstract: 本申请提出了一种基于二维分子图的分子类药性无监督预测方法及装置,其中,该方法包括:首先,在大量包括类药和非类药分子的数据库ChEMBL上,通过原子掩码预测和化学键掩码预测的预训练任务训练教师模型,使其学到了和类药性高度相关的分子拓扑结构的特征;然后,仅在药物数据上蒸馏出一个与教师模型结构相同的学生模型;接着,将一个任意分子分别输入到教师模型和学生模型,并将两个模型输出的特征表示的差距作为这个任意分子的类药性分数;最后,根据类药性分数对这个任意分子的类药性进行预测,以得到预测结果;由此,通过训练好的教师模型和学生模型能够直接捕捉和类药性高度相关的分子特征,同时极大地缓解了一维序列模型的长度偏差问题。

    基于跨模态检索模型的检索方法及装置

    公开(公告)号:CN118260592A

    公开(公告)日:2024-06-28

    申请号:CN202410342673.9

    申请日:2024-03-25

    Applicant: 厦门大学

    Abstract: 本发明提出了一种基于跨模态检索模型的检索方法及装置,该方法包括获取第一跨模数据和对应的第二跨模数据,以便得到成对的训练数据集;建立跨模态检索模型,并采用训练数据集对跨模态检索模型进行训练,其中,跨模态检索模型包括多模态编码器、判别器和基于记忆向量的模态共享特征提取器,以便采用基于记忆向量的模态共享特征提取器增强模态交互,并在训练过程中利用二阶相似度损失增强模态对齐;基于训练好的跨模态检索模型对待检索的第一跨模数据进行检索,以生成待检索的第一跨模数据对应的第二跨模数据;由此,通过在模型结构上加强了模态交互,而且在训练目标上利用二阶相似度增强模态对齐,从而有效提升了跨模态检索模型的检索效果。

Patent Agency Ranking