-
公开(公告)号:CN118629672A
公开(公告)日:2024-09-10
申请号:CN202411110690.6
申请日:2024-08-14
IPC: G16H70/40 , G16H20/10 , G16H50/70 , G06F18/25 , G16C20/50 , G16C20/70 , G16B35/00 , G16B40/00 , G06N3/045 , G06N3/042 , G06N3/0464 , G06N3/0455
Abstract: 本发明公开了一种基于多模态数据融合的药物协同组合预测方法,首先获取药物组合样本的药物特征向量和细胞系基因表达量;接着基于多头自注意力的图注意力网络和最大池化操作提取药物特征向量中的药物分子图特征;再基于可变形卷积网络提取药物特征向量中的药物摩根指纹特征,并通过空间重建模块抑制药物摩根指纹特征的冗余;然后基于多层感知机提取细胞系基因表达量中的细胞系特征;最后采用Transformer将药物分子图特征、重建后的药物摩根指纹特征和细胞系特征进行特征融合,得到药物协同组合预测结果。本发明通过融合药物的多模态数据,增强了模型对药物的表征能力,进而提高了对未知药物协同组合的预测精度和泛化能力。
-
公开(公告)号:CN118609855A
公开(公告)日:2024-09-06
申请号:CN202411078638.7
申请日:2024-08-07
Abstract: 本发明公开了一种基于异构图神经网络和多组学的癌症药物反应预测方法,涉及癌症药物反应预测领域,其通过构建细胞‑药物异构图神经网络,并将异构图神经网络应用到癌症药物反应预测问题模型构建,能够有效地学习细胞系与癌症药物之间存在的复杂联系;并且融合多组学数据,从多组学角度全面地学习细胞系特征,使模型更符合生物学意义,具备更好的鲁棒性,提高了癌症药物反应预测的准确率。
-
公开(公告)号:CN119132426B
公开(公告)日:2025-04-04
申请号:CN202411242471.3
申请日:2024-09-05
IPC: G16B50/10 , G16B20/00 , G16B40/00 , G06F18/213 , G06F18/25 , G06F18/2415 , G06N3/0455 , G06N3/09
Abstract: 本发明公开了一种基于预训练的单细胞多组学的细胞类型注释方法,其属于生物信息技术领域,包括获取配对的scRNA‑seq数据的基因表达矩阵和scATAC‑seq数据的染色质可及性峰值矩阵,并对基因表达矩阵和染色质可及性峰值矩阵进行预处理,之后输入预训练的特征提取器,采用其多头交叉注意力网络得到融合多组学的查询特征矩阵;特征提取器包括多头交叉注意力网络和两个分类器;将查询特征矩阵输入分类模型,采用线性层进行数据拆分,接着输入Transformer编码器进行多组学遗传特征提取,之后输入分类器进行细胞类型注释。本方案的细胞类型注释方法解决了现有方法细胞类型注释存在偏差的问题。
-
公开(公告)号:CN119132426A
公开(公告)日:2024-12-13
申请号:CN202411242471.3
申请日:2024-09-05
IPC: G16B50/10 , G16B20/00 , G16B40/00 , G06F18/213 , G06F18/25 , G06F18/2415 , G06N3/0455 , G06N3/09
Abstract: 本发明公开了一种基于预训练的单细胞多组学的细胞类型注释方法,其属于生物信息技术领域,包括获取配对的scRNA‑seq数据的基因表达矩阵和scATAC‑seq数据的染色质可及性峰值矩阵,并对基因表达矩阵和染色质可及性峰值矩阵进行预处理,之后输入预训练的特征提取器,采用其多头交叉注意力网络得到融合多组学的查询特征矩阵;特征提取器包括多头交叉注意力网络和两个分类器;将查询特征矩阵输入分类模型,采用线性层进行数据拆分,接着输入Transformer编码器进行多组学遗传特征提取,之后输入分类器进行细胞类型注释。本方案的细胞类型注释方法解决了现有方法细胞类型注释存在偏差的问题。
-
公开(公告)号:CN118824350B
公开(公告)日:2024-11-26
申请号:CN202411296576.7
申请日:2024-09-18
IPC: G16B5/00 , G16B40/00 , G06N3/0442 , G06N3/0895
Abstract: 本发明公开了一种单细胞分化轨迹推断方法,涉及细胞分化轨迹分析技术领域,本方法基于DNA序列和RNA序列进行建模,同时预测染色质可及性和基因表达状态,并整合成对的单细胞多组学数据,将分类器的权重作为两种组学的细胞低维特征,利用对比学习学习其中的细胞异质性,提高单细胞的聚类准确率,进而构建准确的单细胞的分化轨迹。本方法采用轻量级深度学习模型,避免了当前众多基于编码解码器结构的单细胞数据融合模型训练困难的尴尬处境,还可以提高数据处理效率。本方法考虑到细胞异质性对于单细胞多组学数据融合的影响,利用对比学习,能够更精准地刻画多组学数据中的单细胞特征,为准确聚类打下基础。
-
公开(公告)号:CN119479808A
公开(公告)日:2025-02-18
申请号:CN202411301445.3
申请日:2024-09-18
IPC: G16B30/00 , G16B40/00 , G16B5/00 , G06F18/10 , G06F18/25 , G06F18/241 , G06N3/0464 , G06N3/0442 , G06N3/0455 , G06N3/0895
Abstract: 本发明公开了一种单细胞数据降噪方法,涉及细胞数据处理领域,本方法基于DNA序列和RNA序列进行建模,同时预测染色质可及性和基因表达状态,并整合成对的单细胞多组学数据,将分类器的权重作为两种组学的细胞低维特征,利用对比学习学习其中的细胞异质性,刻画单细胞数据的真实轮廓和生物学信息,对单细胞数据集进行有效降噪。
-
公开(公告)号:CN119207582A
公开(公告)日:2024-12-27
申请号:CN202411264805.7
申请日:2024-09-10
IPC: G16B40/00 , G16B40/30 , G16B25/10 , G16B50/30 , G16B45/00 , G06N5/04 , G06N3/0455 , G06N3/096 , G06N3/0985 , G06F18/2133 , G06F18/23 , G06F18/27 , G06N3/048
Abstract: 本发明公开了一种基于对比学习的单细胞多组学基因调控网络推理方法,属于生物信息技术领域,其包括获取单细胞RNA测序数据和单细胞染色质可及性数据,并进行预处理得到多组学数据的先验网络;将先验调控网络加载成图结构,并将图结构转换为特征空间矩阵;计算图结构中每条边上两个结点的皮尔逊相关系数,当其大于预设阈值时,作为结点对,将结点对和其对应的特征向量和隐藏向量存储至数据集中;将数据集分成若干批次随机输入对比学习模型,得到每个结点的结点类型、结点对的配对程度和结点特征重建向量;采用调控网络解释器提取结点特征重建向量中两个结点在特征空间中的映射,并基于映射计算结点的结构熵,以此确定结点是否为关键结点。
-
公开(公告)号:CN118629672B
公开(公告)日:2024-10-11
申请号:CN202411110690.6
申请日:2024-08-14
IPC: G16H70/40 , G16H20/10 , G16H50/70 , G06F18/25 , G16C20/50 , G16C20/70 , G16B35/00 , G16B40/00 , G06N3/045 , G06N3/042 , G06N3/0464 , G06N3/0455
Abstract: 本发明公开了一种基于多模态数据融合的药物协同组合预测方法,首先获取药物组合样本的药物特征向量和细胞系基因表达量;接着基于多头自注意力的图注意力网络和最大池化操作提取药物特征向量中的药物分子图特征;再基于可变形卷积网络提取药物特征向量中的药物摩根指纹特征,并通过空间重建模块抑制药物摩根指纹特征的冗余;然后基于多层感知机提取细胞系基因表达量中的细胞系特征;最后采用Transformer将药物分子图特征、重建后的药物摩根指纹特征和细胞系特征进行特征融合,得到药物协同组合预测结果。本发明通过融合药物的多模态数据,增强了模型对药物的表征能力,进而提高了对未知药物协同组合的预测精度和泛化能力。
-
公开(公告)号:CN119580823A
公开(公告)日:2025-03-07
申请号:CN202411627349.8
申请日:2024-11-14
IPC: G16B15/30 , G16B40/00 , G06N3/0464 , G06N3/0442
Abstract: 本发明公开了一种基于双分支网络预测转录因子结合位点的方法,包括:将DNA序列转换为K‑mer标记的序列;将K‑mer标记的序列依次输入至基于BERT架构的预训练模型、循环神经网络BiLSTM中、CNN模块中、双分支Dual‑Branch模块中,输出第二全局特征矩阵和第二局部特征矩阵;将第二全局特征矩阵和第二局部特征矩阵分别输入多层感知器中,输出转录因子结合位点的两个概率;将转录因子结合位点的两个概率整合,输出转录因子结合位点的预测结果。本发明可解释性强决策过程透明化、泛化能力强,对TFBS的预测任务准确率高且当数据量较少时,依旧能够保证良好性能,能够在某细胞系中训练之后预测另一细胞系中的转录因子。
-
公开(公告)号:CN118824350A
公开(公告)日:2024-10-22
申请号:CN202411296576.7
申请日:2024-09-18
IPC: G16B5/00 , G16B40/00 , G06N3/0442 , G06N3/0895
Abstract: 本发明公开了一种单细胞分化轨迹推断方法,涉及细胞分化轨迹分析技术领域,本方法基于DNA序列和RNA序列进行建模,同时预测染色质可及性和基因表达状态,并整合成对的单细胞多组学数据,将分类器的权重作为两种组学的细胞低维特征,利用对比学习学习其中的细胞异质性,提高单细胞的聚类准确率,进而构建准确的单细胞的分化轨迹。本方法采用轻量级深度学习模型,避免了当前众多基于编码解码器结构的单细胞数据融合模型训练困难的尴尬处境,还可以提高数据处理效率。本方法考虑到细胞异质性对于单细胞多组学数据融合的影响,利用对比学习,能够更精准地刻画多组学数据中的单细胞特征,为准确聚类打下基础。
-
-
-
-
-
-
-
-
-