基于多源数据融合的药物疾病关联预测方法、装置及设备

    公开(公告)号:CN117133436A

    公开(公告)日:2023-11-28

    申请号:CN202311346273.7

    申请日:2023-10-17

    Abstract: 本发明公开了一种基于多源数据融合的药物疾病关联预测方法、装置及设备,该方法包括:基于预设元路径在异构网络中进行随机单向游走获得源药物节点的邻域和目标疾病节点的邻域;计算邻域间的嵌入表示,确定虚拟节点之间的归一化的注意力系数;基于归一化的注意力系数确定的邻域间的相互作用表示的标准化注意力值;将标准化注意力值与虚拟节点的嵌入表示融合,将融合获得的药物疾病节点对间边的嵌入表示与对应的初始嵌入特征进行拼接,施加一个多层感知机获得药物疾病对的预测结果。如此,基于预设元路径进行随机游走取样,并基于邻域间嵌入表示、邻域内相互作用结果进行结果预测,提取了异构网络的丰富语义信息,提高模型对药物疾病的预测性能。

    基于图表示学习的环状RNA-疾病关联预测方法

    公开(公告)号:CN117393143A

    公开(公告)日:2024-01-12

    申请号:CN202311316888.5

    申请日:2023-10-11

    Abstract: 本发明公开了一种基于图表示学习的环状RNA‑疾病关联预测方法、移动设备及存储介质,该方法包括:基于环状RNA及相关信息构建环状RNA的异构网络,所述异构网络包括环状RNA节点和疾病节点;将异构网络中各个节点的特征随机初始化后输入图表示学习模型,通过所述图表示学习模型按预设流程学习各个节点的表示向量;基于环状RNA节点的表示向量和疾病节点的表示向量的内积确定为对应环状RNA与疾病的关联预测得分。如此,通过图表示学习模型学习异构网络中各个节点的表示向量,再基于环状RNA节点和疾病节点的表示向量的内积确定关联预测得分,提高了异构网络构建的灵活性,使得图表示学习模型能获得更丰富的节点表示,提高了环状RNA‑疾病预测的准确性。

    一种蛋白质功能预测模型生成方法及装置

    公开(公告)号:CN116884473A

    公开(公告)日:2023-10-13

    申请号:CN202310581243.8

    申请日:2023-05-22

    Abstract: 本发明公开了一种蛋白质功能预测模型生成方法及装置,包括获取训练蛋白质的氨基酸三维原子坐标,并根据其进行图论方法生成蛋白质二维接触图;对训练蛋白质的氨基酸三维原子坐标进行算法处理获取第一特征矩阵,对蛋白质二维接触图进行算法处理获取第二特征矩阵,第一特征矩阵与训练蛋白质的氨基酸三维原子坐标中序列作用位点对应,第二特征矩阵与训练蛋白质的氨基酸三维原子坐标中结构作用折叠结构对应;根据第一特征矩阵和第二特征矩阵分别对应的数据标签训练预先构建的蛋白质功能分类器,得到蛋白质功能预测模型。通过将训练蛋白质的氨基酸结构和序列作为信息源提取特征,提高了预测模型对蛋白质功能的预测精度。

    基于图神经网络的基因模块挖掘方法、装置、计算机设备

    公开(公告)号:CN113611366B

    公开(公告)日:2022-04-29

    申请号:CN202110854545.9

    申请日:2021-07-26

    Abstract: 本发明公开了一种基于图神经网络的基因模块挖掘方法、装置、计算机设备。其中,所述方法包括:根据基因表达谱数据,构造基因共表达网络,和基于该构造的基因共表达网络,通过图神经网络方式,配置社区隶属度矩阵,以及基于该配置的社区隶属度矩阵,通过设定阈值的方式,生成已知模块。通过上述方式,能够实现通过图神经网络表示学习的方式配置社区归属矩阵,再通过设定阈值的方式生成已知模块,实现在基因模块挖掘结果上能够允许有密集连接的多个基因可归属于不同的模块。

    一种基于信息熵的基因序列数字化实现方法及系统

    公开(公告)号:CN109903812A

    公开(公告)日:2019-06-18

    申请号:CN201910133090.4

    申请日:2019-02-22

    Abstract: 本发明公开了一种基于信息熵的基因序列数字化实现方法及系统。其中,所述方法包括:输入脱氧核糖核酸DNA序列,设定滑动窗口的长度l及子串长度n,和根据该设定的滑动窗口的长度l,从该输入的脱氧核糖核酸DNA序列的第一个碱基开始,步长为1,和计算该设定的滑动窗口内的给定子串长度下的拓扑熵大小,赋值给该设定的滑动窗口内的碱基,和重复计算该设定的滑动窗口内的给定子串长度下的拓扑熵大小,赋值给该设定的滑动窗口内的碱基,直到到达该输入的脱氧核糖核酸DNA序列的最后一个碱基位置,和输出得到同该输入的脱氧核糖核酸DNA序列长度的数字序列。通过上述方式,能够实现预测基因序列中的外显子区域。

    用于疾病预测的异质图表示方法、装置、设备及存储介质

    公开(公告)号:CN114141375A

    公开(公告)日:2022-03-04

    申请号:CN202111504144.7

    申请日:2021-12-10

    Abstract: 本发明公开了一种异质图表示方法、异质图表示设备、移动设备及存储介质,该方法包括:基于元路径将同一向量空间的异构图转化为同构图,各个同构图的节点类型与其源节点相同;对所述同构图的每个节点的子图进行分解,获得多个因子图;采用双注意力机制对所述多个因子图进行邻居信息聚合,并拼接聚合后的特征信息,获得元路径的节点特征向量;对不同元路径的节点特征向量进行融合,获得异构图节点的节点嵌入。由此,将异构图转化为同构图后,对节点的子图进行分解获得大量的因子图,并通过双注意力机制对因子图进行邻居信息聚合,以获得该异构图的节点嵌入,进而得到了异构图全面、准确的信息,提高了机器学习中基于少量数据的信息提取的准确性和全面性。

Patent Agency Ranking