一种基于双模态的药物靶标多标签分类方法

    公开(公告)号:CN116469484A

    公开(公告)日:2023-07-21

    申请号:CN202310404563.6

    申请日:2023-04-17

    Applicant: 东北大学

    Abstract: 本发明提供一种基于双模态的药物靶标多标签分类方法,涉及药物靶标分类技术领域。该方法首先获得药物靶标数据集,并训练Transformer编码器,得到药物整体的向量表示;构建药物靶标数据集的靶标标签共现图,并生成若干个标签子空间;再将药物分割成多个药物子结构图构成一个药物图包;对于每个标签子空间中的若干靶标标签,在药物靶标数据集中获得所有与该靶标存在相互作用的药物,计算得到整个标签子空间的特征向量;在每个标签子空间中,获取药物图包的代表子结构特征向量;将药物图包的特征向量与药物SMILES序列的特征向量拼接后通过多标签分类器进行分类;将所有标签子空间上分类结果进行集成作为药物靶标的分类结果。

Patent Agency Ranking