基于知识增强语言模型的蛋白质相互作用调节剂预测方法、系统和计算机可读存储介质

    公开(公告)号:CN119993283A

    公开(公告)日:2025-05-13

    申请号:CN202510464934.9

    申请日:2025-04-15

    Abstract: 本发明公开了一种基于知识增强语言模型的蛋白质相互作用调节剂预测方法,包括,调节剂模型构建:预训练文本编码器,引入基于指纹的结构编码器,拼接文本编码器输出的文本嵌入和结构编码器输出的多种指纹嵌入生成调节剂特征;蛋白质模型构建:收集GO图和GO注释,基于GO图训练图嵌入模型,使用训练后的图嵌入模型为每个GO术语节点生成结构特征,结合GO术语的结构特征输出GO术语嵌入向量,基于多个GO术语嵌入向量生成蛋白质特征;预测模型构建:以调节剂特征和蛋白质特征为输入,输出相互作用特征,并基于相互作用特征输出预测结果。本方案通过自然语言的细微表达与生物分子结构属性的融合实现了蛋白质相互作用调节剂预测性能的有效提升。

    一种植物中sgRNA活性预测方法及装置

    公开(公告)号:CN113838529A

    公开(公告)日:2021-12-24

    申请号:CN202111138368.0

    申请日:2021-09-27

    Abstract: 本发明提供一种植物中sgRNA活性预测方法及装置,方法包括:下载sgRNA活性序列数据集,sgRNA活性序列数据集包括植物sgRNA活性数据;采用热编码方法对植物sgRNA活性数据进行编码,得到植物sgRNA序列数据;采用k‑mer编码方法对植物sgRNA序列数据进行二次编码;通过编码后的sgRNA活性序列数据集构建卷积神经网络模型;通过卷积神经网络模型按设定次数n分别对编码后的sgRNA活性序列数据集进行预测训练,得到n个训练模型,将n个训练模型集成,得到卷积神经网络预测模型sgRNACNN;将待预测的植物sgRNA活性序列输入卷积神经网络预测模型sgRNACNN中,得到预测结果。本发明的卷积神经网络预测模型sgRNACNN泛化性能较好,可应用于多物种植物sgRNA活性预测,能够实现对sgRNA活性的准确识别,具有较好的实用性能。

    一种sgRNA的靶标活性预测方法、装置、设备和存储介质

    公开(公告)号:CN113409889A

    公开(公告)日:2021-09-17

    申请号:CN202110569021.5

    申请日:2021-05-25

    Inventor: 邹权 牛梦婷

    Abstract: 本申请提供了一种sgRNA的靶标活性预测方法、装置、设备和存储介质。方法包括:获取sgRNA序列数据集;对所述sgRNA序列数据集进行序列特征提取,得到多个特征信息;将所述多个特征信息进行融合,得到特征集;基于所述特征集对种子模型进行训练,得到活性预测模型;获取待预测sgRNA序列;基于所述活性预测模型,预测所述待预测sgRNA序列的靶标活性。能够确定sgRNA的靶标活性。

    基于共享单元的环状RNA和疾病关联预测模型的构建方法、预测系统和预测方法

    公开(公告)号:CN119400252A

    公开(公告)日:2025-02-07

    申请号:CN202510012421.4

    申请日:2025-01-06

    Abstract: 本发明公开了一种基于共享单元的环状RNA和疾病关联预测模型的构建方法、预测系统和预测方法,通过构建的环状RNA和疾病关联预测模型实现关联预测,包括:基于已知关联数据集构建环状RNA元路径网络、环状RNA相似性网络、疾病元路径网络和疾病相似性网络,对前述网络分别进行特征提取得到环状RNA相似性特征、环状RNA元路径特征、疾病相似性特征和疾病元路径特征;相似性特征和元路径特征被同时输入至共享单元;共享单元输出的相似性特征被输入至多层感知机进行环状RNA与疾病的关联预测并更新模型参数。为模型设计共享单元,通过构建环状RNA和疾病的相似性网络及元路径网络,通过在多视图特征融合过程中捕获潜在的跨视图信息,从而提升模型的预测性能。

Patent Agency Ranking