一种添加的掩码的scRNA-seq测序数据PCA降维方法

    公开(公告)号:CN119252341A

    公开(公告)日:2025-01-03

    申请号:CN202411262514.4

    申请日:2024-09-10

    Abstract: 本发明公开了一种添加的掩码的scRNA‑seq测序数据PCA降维方法,涉及生物信息技术领域,其技术方案要点是:包括采集数据并进行预处理,得到原始基因表达矩阵;添加掩码,筛选并掩盖低可变基因,从而得出掩码矩阵;奇异值分解,使用SVD分解求出降维矩阵;PCA降维,根据降维矩阵的特征值与原始基因表达矩阵相乘,得到降维结果;聚类可视化,使用leiden方法进行聚类,使用T‑SNE方法进行可视化。本发明提出了一种添加的掩码的scRNA‑seq测序数据PCA降维方法,通过添加掩码的方式保留低表达基因之间的潜在联系,同时采用从基因表达综合中心(GEO)下载的数据集,经过传统PCA与掩码PCA方法分别降维,通过聚类精确度比较方法效果,结果表明了在大部分数据集上,聚类效果得到了明显提升。

    一种单细胞多组学数据整合方法
    2.
    发明公开

    公开(公告)号:CN119252326A

    公开(公告)日:2025-01-03

    申请号:CN202411262388.2

    申请日:2024-09-10

    Abstract: 本发明公开了一种单细胞多组学数据整合方法,涉及生物信息技术领域,其技术要点为:S1:对单细胞RNA测序数据与单细胞ATAC测序数据进行预处理,包括数据筛选与基因选择两个部分;S2:构建低维共享空间,使用自编码器构建一个两种组学数据的低维共享空间;S3:使用低维共享空间中的单细胞RNA测序数据训练深度金字塔卷积神经网络;S4:使用训练好的深度金字塔卷积神经网络,对单细胞ATAC测序数据进行分类,得到细胞类型标签,实现单细胞RNA测序数据与单细胞ATAC测序数据的数据整合。本发明通过使用自编码器网络,构建出低维共享空间,最大化不同组学数据之间的相似性,通过文本卷积网络学习不同细胞类型数据之间的分布,最终实现整合多组学数据的目的。

Patent Agency Ranking