-
公开(公告)号:CN119889442A
公开(公告)日:2025-04-25
申请号:CN202411645264.2
申请日:2024-11-18
IPC: G16B30/00 , G16B25/00 , G16B40/00 , G06F18/2431 , G06F18/21 , G06N3/0895 , G06N3/096 , G06N3/048
Abstract: 本发明公开了一种基于自监督蒸馏学习的细胞类型注释方法,属于细胞类型注释的技术领域,包括根据细胞之间的余弦相似度,构建细胞特异性高相关网络;将单细胞转录组数据张量和细胞特异性高相关网络中各节点拼接张量进行拼接处理,得到拼接数据;将拼接数据送入全局学习层进行自监督蒸馏学习,提取scRNA‑seq数据的特征信息;基于特征信息,采用KAN模型对scRNA‑seq数据进行细胞类型注释。本发明使用scTCHCN作为scRNA‑seq数据深层次特征提取的下游任务模型,可以提高模型的通用性,克服批次效应带来的噪声影响,提供在细胞类型注释方面高度可扩展的稳健且准确的能力。
-
公开(公告)号:CN118629672A
公开(公告)日:2024-09-10
申请号:CN202411110690.6
申请日:2024-08-14
IPC: G16H70/40 , G16H20/10 , G16H50/70 , G06F18/25 , G16C20/50 , G16C20/70 , G16B35/00 , G16B40/00 , G06N3/045 , G06N3/042 , G06N3/0464 , G06N3/0455
Abstract: 本发明公开了一种基于多模态数据融合的药物协同组合预测方法,首先获取药物组合样本的药物特征向量和细胞系基因表达量;接着基于多头自注意力的图注意力网络和最大池化操作提取药物特征向量中的药物分子图特征;再基于可变形卷积网络提取药物特征向量中的药物摩根指纹特征,并通过空间重建模块抑制药物摩根指纹特征的冗余;然后基于多层感知机提取细胞系基因表达量中的细胞系特征;最后采用Transformer将药物分子图特征、重建后的药物摩根指纹特征和细胞系特征进行特征融合,得到药物协同组合预测结果。本发明通过融合药物的多模态数据,增强了模型对药物的表征能力,进而提高了对未知药物协同组合的预测精度和泛化能力。
-
-
公开(公告)号:CN119132426B
公开(公告)日:2025-04-04
申请号:CN202411242471.3
申请日:2024-09-05
IPC: G16B50/10 , G16B20/00 , G16B40/00 , G06F18/213 , G06F18/25 , G06F18/2415 , G06N3/0455 , G06N3/09
Abstract: 本发明公开了一种基于预训练的单细胞多组学的细胞类型注释方法,其属于生物信息技术领域,包括获取配对的scRNA‑seq数据的基因表达矩阵和scATAC‑seq数据的染色质可及性峰值矩阵,并对基因表达矩阵和染色质可及性峰值矩阵进行预处理,之后输入预训练的特征提取器,采用其多头交叉注意力网络得到融合多组学的查询特征矩阵;特征提取器包括多头交叉注意力网络和两个分类器;将查询特征矩阵输入分类模型,采用线性层进行数据拆分,接着输入Transformer编码器进行多组学遗传特征提取,之后输入分类器进行细胞类型注释。本方案的细胞类型注释方法解决了现有方法细胞类型注释存在偏差的问题。
-
公开(公告)号:CN119132426A
公开(公告)日:2024-12-13
申请号:CN202411242471.3
申请日:2024-09-05
IPC: G16B50/10 , G16B20/00 , G16B40/00 , G06F18/213 , G06F18/25 , G06F18/2415 , G06N3/0455 , G06N3/09
Abstract: 本发明公开了一种基于预训练的单细胞多组学的细胞类型注释方法,其属于生物信息技术领域,包括获取配对的scRNA‑seq数据的基因表达矩阵和scATAC‑seq数据的染色质可及性峰值矩阵,并对基因表达矩阵和染色质可及性峰值矩阵进行预处理,之后输入预训练的特征提取器,采用其多头交叉注意力网络得到融合多组学的查询特征矩阵;特征提取器包括多头交叉注意力网络和两个分类器;将查询特征矩阵输入分类模型,采用线性层进行数据拆分,接着输入Transformer编码器进行多组学遗传特征提取,之后输入分类器进行细胞类型注释。本方案的细胞类型注释方法解决了现有方法细胞类型注释存在偏差的问题。
-
公开(公告)号:CN118824350B
公开(公告)日:2024-11-26
申请号:CN202411296576.7
申请日:2024-09-18
IPC: G16B5/00 , G16B40/00 , G06N3/0442 , G06N3/0895
Abstract: 本发明公开了一种单细胞分化轨迹推断方法,涉及细胞分化轨迹分析技术领域,本方法基于DNA序列和RNA序列进行建模,同时预测染色质可及性和基因表达状态,并整合成对的单细胞多组学数据,将分类器的权重作为两种组学的细胞低维特征,利用对比学习学习其中的细胞异质性,提高单细胞的聚类准确率,进而构建准确的单细胞的分化轨迹。本方法采用轻量级深度学习模型,避免了当前众多基于编码解码器结构的单细胞数据融合模型训练困难的尴尬处境,还可以提高数据处理效率。本方法考虑到细胞异质性对于单细胞多组学数据融合的影响,利用对比学习,能够更精准地刻画多组学数据中的单细胞特征,为准确聚类打下基础。
-
公开(公告)号:CN119479808A
公开(公告)日:2025-02-18
申请号:CN202411301445.3
申请日:2024-09-18
IPC: G16B30/00 , G16B40/00 , G16B5/00 , G06F18/10 , G06F18/25 , G06F18/241 , G06N3/0464 , G06N3/0442 , G06N3/0455 , G06N3/0895
Abstract: 本发明公开了一种单细胞数据降噪方法,涉及细胞数据处理领域,本方法基于DNA序列和RNA序列进行建模,同时预测染色质可及性和基因表达状态,并整合成对的单细胞多组学数据,将分类器的权重作为两种组学的细胞低维特征,利用对比学习学习其中的细胞异质性,刻画单细胞数据的真实轮廓和生物学信息,对单细胞数据集进行有效降噪。
-
公开(公告)号:CN118629672B
公开(公告)日:2024-10-11
申请号:CN202411110690.6
申请日:2024-08-14
IPC: G16H70/40 , G16H20/10 , G16H50/70 , G06F18/25 , G16C20/50 , G16C20/70 , G16B35/00 , G16B40/00 , G06N3/045 , G06N3/042 , G06N3/0464 , G06N3/0455
Abstract: 本发明公开了一种基于多模态数据融合的药物协同组合预测方法,首先获取药物组合样本的药物特征向量和细胞系基因表达量;接着基于多头自注意力的图注意力网络和最大池化操作提取药物特征向量中的药物分子图特征;再基于可变形卷积网络提取药物特征向量中的药物摩根指纹特征,并通过空间重建模块抑制药物摩根指纹特征的冗余;然后基于多层感知机提取细胞系基因表达量中的细胞系特征;最后采用Transformer将药物分子图特征、重建后的药物摩根指纹特征和细胞系特征进行特征融合,得到药物协同组合预测结果。本发明通过融合药物的多模态数据,增强了模型对药物的表征能力,进而提高了对未知药物协同组合的预测精度和泛化能力。
-
公开(公告)号:CN119580823A
公开(公告)日:2025-03-07
申请号:CN202411627349.8
申请日:2024-11-14
IPC: G16B15/30 , G16B40/00 , G06N3/0464 , G06N3/0442
Abstract: 本发明公开了一种基于双分支网络预测转录因子结合位点的方法,包括:将DNA序列转换为K‑mer标记的序列;将K‑mer标记的序列依次输入至基于BERT架构的预训练模型、循环神经网络BiLSTM中、CNN模块中、双分支Dual‑Branch模块中,输出第二全局特征矩阵和第二局部特征矩阵;将第二全局特征矩阵和第二局部特征矩阵分别输入多层感知器中,输出转录因子结合位点的两个概率;将转录因子结合位点的两个概率整合,输出转录因子结合位点的预测结果。本发明可解释性强决策过程透明化、泛化能力强,对TFBS的预测任务准确率高且当数据量较少时,依旧能够保证良好性能,能够在某细胞系中训练之后预测另一细胞系中的转录因子。
-
公开(公告)号:CN118824350A
公开(公告)日:2024-10-22
申请号:CN202411296576.7
申请日:2024-09-18
IPC: G16B5/00 , G16B40/00 , G06N3/0442 , G06N3/0895
Abstract: 本发明公开了一种单细胞分化轨迹推断方法,涉及细胞分化轨迹分析技术领域,本方法基于DNA序列和RNA序列进行建模,同时预测染色质可及性和基因表达状态,并整合成对的单细胞多组学数据,将分类器的权重作为两种组学的细胞低维特征,利用对比学习学习其中的细胞异质性,提高单细胞的聚类准确率,进而构建准确的单细胞的分化轨迹。本方法采用轻量级深度学习模型,避免了当前众多基于编码解码器结构的单细胞数据融合模型训练困难的尴尬处境,还可以提高数据处理效率。本方法考虑到细胞异质性对于单细胞多组学数据融合的影响,利用对比学习,能够更精准地刻画多组学数据中的单细胞特征,为准确聚类打下基础。
-
-
-
-
-
-
-
-
-