基于知识增强语言模型的蛋白质相互作用调节剂预测方法、系统和计算机可读存储介质

    公开(公告)号:CN119993283A

    公开(公告)日:2025-05-13

    申请号:CN202510464934.9

    申请日:2025-04-15

    Abstract: 本发明公开了一种基于知识增强语言模型的蛋白质相互作用调节剂预测方法,包括,调节剂模型构建:预训练文本编码器,引入基于指纹的结构编码器,拼接文本编码器输出的文本嵌入和结构编码器输出的多种指纹嵌入生成调节剂特征;蛋白质模型构建:收集GO图和GO注释,基于GO图训练图嵌入模型,使用训练后的图嵌入模型为每个GO术语节点生成结构特征,结合GO术语的结构特征输出GO术语嵌入向量,基于多个GO术语嵌入向量生成蛋白质特征;预测模型构建:以调节剂特征和蛋白质特征为输入,输出相互作用特征,并基于相互作用特征输出预测结果。本方案通过自然语言的细微表达与生物分子结构属性的融合实现了蛋白质相互作用调节剂预测性能的有效提升。

Patent Agency Ranking