-
公开(公告)号:CN116629123A
公开(公告)日:2023-08-22
申请号:CN202310601945.8
申请日:2023-05-25
Applicant: 南开大学
Abstract: 本发明属于单细胞多组学分析领域,提供了一种基于配对的单细胞多组学数据整合方法及系统,包括获取配对的单细胞多组学数据并进行预处理,得到不同组学的表达矩阵;基于不同组学的表达矩阵,利用预先训练好的伪孪生神经网络模型将不同组学的表达矩阵嵌入在同一维度空间下进行数据整合,得到整合后的单细胞多组学数据;在训练阶段基于不同组学的表达矩阵,利用不同的变分自编码器生成不同的细胞表达矩阵,该数据将有助于得到更好的预先训练好的孪生神经网络模型。本发明进行配对细胞联合嵌入时,消除了不同批次数据的批次效应问题,且保护了大量生物学信息,使得在低纬空间下的细胞类型分布更加明显,并保持了高水平的细胞对齐关系。