-
公开(公告)号:CN119889442A
公开(公告)日:2025-04-25
申请号:CN202411645264.2
申请日:2024-11-18
IPC: G16B30/00 , G16B25/00 , G16B40/00 , G06F18/2431 , G06F18/21 , G06N3/0895 , G06N3/096 , G06N3/048
Abstract: 本发明公开了一种基于自监督蒸馏学习的细胞类型注释方法,属于细胞类型注释的技术领域,包括根据细胞之间的余弦相似度,构建细胞特异性高相关网络;将单细胞转录组数据张量和细胞特异性高相关网络中各节点拼接张量进行拼接处理,得到拼接数据;将拼接数据送入全局学习层进行自监督蒸馏学习,提取scRNA‑seq数据的特征信息;基于特征信息,采用KAN模型对scRNA‑seq数据进行细胞类型注释。本发明使用scTCHCN作为scRNA‑seq数据深层次特征提取的下游任务模型,可以提高模型的通用性,克服批次效应带来的噪声影响,提供在细胞类型注释方面高度可扩展的稳健且准确的能力。
-
公开(公告)号:CN118629672A
公开(公告)日:2024-09-10
申请号:CN202411110690.6
申请日:2024-08-14
IPC: G16H70/40 , G16H20/10 , G16H50/70 , G06F18/25 , G16C20/50 , G16C20/70 , G16B35/00 , G16B40/00 , G06N3/045 , G06N3/042 , G06N3/0464 , G06N3/0455
Abstract: 本发明公开了一种基于多模态数据融合的药物协同组合预测方法,首先获取药物组合样本的药物特征向量和细胞系基因表达量;接着基于多头自注意力的图注意力网络和最大池化操作提取药物特征向量中的药物分子图特征;再基于可变形卷积网络提取药物特征向量中的药物摩根指纹特征,并通过空间重建模块抑制药物摩根指纹特征的冗余;然后基于多层感知机提取细胞系基因表达量中的细胞系特征;最后采用Transformer将药物分子图特征、重建后的药物摩根指纹特征和细胞系特征进行特征融合,得到药物协同组合预测结果。本发明通过融合药物的多模态数据,增强了模型对药物的表征能力,进而提高了对未知药物协同组合的预测精度和泛化能力。
-
-
公开(公告)号:CN116312765A
公开(公告)日:2023-06-23
申请号:CN202310122535.5
申请日:2023-02-15
Applicant: 成都信息工程大学
IPC: G16B20/20 , G16B40/20 , G16B30/00 , G06N3/0464
Abstract: 本发明提供了一种基于多阶段的非编码变异对增强子活性影响预测方法,涉及生物信息技术领域,该方法包括获取增强子相关特征,并对其进行预处理;构建并训练基于元学习的染色质特征预测模型;基于特征融合模型得到融合多染色质特征的联合表征;构建和训练基于多染色质特征联合表征的增强子活性预测模型;利用染色质特征预测模型以及增强子活性预测模型预测变异对增强子活性的影响;根据变异对增强子活性的影响,对功能性变异进行筛选。本发明提出了一个有效的增强子活性预测框架,实现变异对增强子活性影响的精确预测,解决了传统方法基于DNA序列进行预测,效果不佳的缺点。
-
公开(公告)号:CN119479808A
公开(公告)日:2025-02-18
申请号:CN202411301445.3
申请日:2024-09-18
IPC: G16B30/00 , G16B40/00 , G16B5/00 , G06F18/10 , G06F18/25 , G06F18/241 , G06N3/0464 , G06N3/0442 , G06N3/0455 , G06N3/0895
Abstract: 本发明公开了一种单细胞数据降噪方法,涉及细胞数据处理领域,本方法基于DNA序列和RNA序列进行建模,同时预测染色质可及性和基因表达状态,并整合成对的单细胞多组学数据,将分类器的权重作为两种组学的细胞低维特征,利用对比学习学习其中的细胞异质性,刻画单细胞数据的真实轮廓和生物学信息,对单细胞数据集进行有效降噪。
-
公开(公告)号:CN118629672B
公开(公告)日:2024-10-11
申请号:CN202411110690.6
申请日:2024-08-14
IPC: G16H70/40 , G16H20/10 , G16H50/70 , G06F18/25 , G16C20/50 , G16C20/70 , G16B35/00 , G16B40/00 , G06N3/045 , G06N3/042 , G06N3/0464 , G06N3/0455
Abstract: 本发明公开了一种基于多模态数据融合的药物协同组合预测方法,首先获取药物组合样本的药物特征向量和细胞系基因表达量;接着基于多头自注意力的图注意力网络和最大池化操作提取药物特征向量中的药物分子图特征;再基于可变形卷积网络提取药物特征向量中的药物摩根指纹特征,并通过空间重建模块抑制药物摩根指纹特征的冗余;然后基于多层感知机提取细胞系基因表达量中的细胞系特征;最后采用Transformer将药物分子图特征、重建后的药物摩根指纹特征和细胞系特征进行特征融合,得到药物协同组合预测结果。本发明通过融合药物的多模态数据,增强了模型对药物的表征能力,进而提高了对未知药物协同组合的预测精度和泛化能力。
-
公开(公告)号:CN116153404A
公开(公告)日:2023-05-23
申请号:CN202310182496.8
申请日:2023-02-28
Applicant: 成都信息工程大学
IPC: G16B25/00 , G16B40/00 , G06N3/0455
Abstract: 本发明公开了一种单细胞ATAC‑seq数据分析方法,通过提取单细胞分辨率的染色质可达性特征峰序列中转录因子‑DNA结合基元的所属种类、相对位置、长距离依赖关系等众多转录调控语法规则,从而更全面地表示单个细胞的功能状态和高阶特征。此外,本发明方法利用获取的转录调控语法规则、细胞功能状态和高阶特征,一站式地实现染色质可达性预测、细胞类型注释、染色质可达性图谱降噪、转录因子活性推断等一系列下游分析任务。
-
公开(公告)号:CN115938592B
公开(公告)日:2023-05-05
申请号:CN202310220890.6
申请日:2023-03-09
Applicant: 成都信息工程大学
IPC: G16H50/30 , G06F18/25 , G16B20/10 , G06N3/0464 , G06N3/0455 , G06N3/08
Abstract: 本发明公开了一种基于局部增强图卷积网络的癌症预后预测方法,属于医学技术领域,包括以下步骤:S1:获取多组学数据和通路原始数据,并利用多组学数据路和通路原始数据构建无向图;S2:对无向图进行局部增强;S3:利用图卷积网络对局部增强后的无向图进行特征提取和特征融合,得到整体特征映射组合;S4:根据整体特征映射组合,构建比例风险模型,将整体特征映射组合输入至比例风险模型中,确定患者生存风险。本发明通过对癌症相关组学数据构建图神经网络学习,对患者进行预后预测及分析,可以为生物实验提供一定指导,从而有效减少实验时间与节省实验成本。
-
公开(公告)号:CN115810398A
公开(公告)日:2023-03-17
申请号:CN202211696499.5
申请日:2022-12-28
Applicant: 成都信息工程大学
Abstract: 本发明公开了一种基于多特征融合的TF‑DNA结合识别方法,包括:S1:获得人类常见组织的五种与转录因子结合相关的原始数据;S2:对多种数据进行预处理;S3:对预处理后的原始数据中的DNA序列数据进行数据编码处理;S4:对预处理后的原始数据中的其他数据进行归一化处理;S5:利用多特征融合的自注意力机制和卷积神经网络对编码后的DNA序列数据和归一化后的数据进行全局依赖提取、特征提取和特征融合,得到整体特征映射组合;S6:根据整体特征映射组合,对多特征融合的TF‑DNA结合识别模型进行训练,得到训练后的多特征融合的TF‑DNA结合识别模型;S7:利用训练后的多特征融合的TF‑DNA结合识别模型对待识别数据进行识别。
-
公开(公告)号:CN119132426B
公开(公告)日:2025-04-04
申请号:CN202411242471.3
申请日:2024-09-05
IPC: G16B50/10 , G16B20/00 , G16B40/00 , G06F18/213 , G06F18/25 , G06F18/2415 , G06N3/0455 , G06N3/09
Abstract: 本发明公开了一种基于预训练的单细胞多组学的细胞类型注释方法,其属于生物信息技术领域,包括获取配对的scRNA‑seq数据的基因表达矩阵和scATAC‑seq数据的染色质可及性峰值矩阵,并对基因表达矩阵和染色质可及性峰值矩阵进行预处理,之后输入预训练的特征提取器,采用其多头交叉注意力网络得到融合多组学的查询特征矩阵;特征提取器包括多头交叉注意力网络和两个分类器;将查询特征矩阵输入分类模型,采用线性层进行数据拆分,接着输入Transformer编码器进行多组学遗传特征提取,之后输入分类器进行细胞类型注释。本方案的细胞类型注释方法解决了现有方法细胞类型注释存在偏差的问题。
-
-
-
-
-
-
-
-
-