基于小样本学习的蛋白质-靶点亲和力预测方法、系统、存储介质及终端

    公开(公告)号:CN118522343A

    公开(公告)日:2024-08-20

    申请号:CN202410469576.6

    申请日:2024-04-18

    Abstract: 本发明公开了基于小样本学习的蛋白质‑靶点亲和力预测方法、系统、存储介质及终端,属于蛋白质预测技术领域,包括:S1、蛋白质序列特征提取;S2、药物靶点SMILES码特征提取;S3、融合步骤S1和步骤S2中提取的特征数据,得到蛋白质‑靶点特征数据;S4、构建蛋白质‑靶点亲和力预测模型,并使用所述蛋白质‑靶点特征数据对所述蛋白质‑靶点亲和力预测模型进行训练;其中,将所述蛋白质‑靶点特征数据划分为训练集、验证集和测试集;训练过程中,使用验证集补充训练集的方式进行动态训练,当验证集数量降到一定阈值时,停止补充训练集;S5、将测试集数据放入已训练好的蛋白质‑靶点亲和力预测模型中,得到蛋白质‑靶点亲和力预测结果。本发明能够有效解决在蛋白质‑靶点亲和力预测过程中,因训练样本过少而造成的过拟合问题,同时可以为小样本学习问题中抵御过拟合风险提供新的视角。

    一种分子图特征提取方法、装置、存储介质及终端

    公开(公告)号:CN116153434B

    公开(公告)日:2024-07-16

    申请号:CN202310273569.4

    申请日:2023-03-20

    Abstract: 本发明公开了一种基于哈密顿量编码的分子图特征提取方法、装置、存储介质及终端,包括:将药物分子的分子图通过时间演化方法转化为哈密顿量;将时间演化得到的哈密顿量映射到量子系统;根据映射后的哈密顿量构建量子处理器并测量哈密顿量的期望值;将得到的期望值输入神经网络模型,提取分子图的特征。本发明通过对药物分子的分子图直接进行特征提取,将能够极大程度地保留药物分子的特征信息;通过伊辛哈密顿量结合时间演化的方式,提高了运算速度。同时,可以构建一个专用于生物医药领域的量子数据集,能够极大地促进生物医药领域的发展。

    一种基于哈密顿量编码的分子图特征提取方法、装置、存储介质及终端

    公开(公告)号:CN116153434A

    公开(公告)日:2023-05-23

    申请号:CN202310273569.4

    申请日:2023-03-20

    Abstract: 本发明公开了一种基于哈密顿量编码的分子图特征提取方法、装置、存储介质及终端,包括:将药物分子的分子图通过时间演化方法转化为哈密顿量;将时间演化得到的哈密顿量映射到量子系统;根据映射后的哈密顿量构建量子处理器并测量哈密顿量的期望值;将得到的期望值输入神经网络模型,提取分子图的特征。本发明通过对药物分子的分子图直接进行特征提取,将能够极大程度地保留药物分子的特征信息;通过伊辛哈密顿量结合时间演化的方式,提高了运算速度。同时,可以构建一个专用于生物医药领域的量子数据集,能够极大地促进生物医药领域的发展。

Patent Agency Ranking