一种针对不平衡单细胞RNA-seq数据的细胞聚类方法、设备和介质

    公开(公告)号:CN118016167B

    公开(公告)日:2025-03-04

    申请号:CN202410085639.8

    申请日:2024-01-22

    Applicant: 中南大学

    Abstract: 本发明公开了一种针对不平衡单细胞RNA‑seq数据的细胞聚类方法、设备和介质,方法包括:获取聚类细胞的RNA‑seq数据,生成基因表达矩阵并预处理;利用基因表达矩阵计算各细胞间的相似度,选出近似细胞作为对比学习的附加增强正例;搭建对比学习模型,并利用各细胞的正例、附加增强正例和负例训练对比学习模型,以获取细胞潜在表征;基于细胞的潜在表征对所有细胞聚类,生成细胞的伪标签;基于细胞的潜在表征计算细胞间的距离值进而选择锚点细胞;搭建知识蒸馏模型,利用锚点细胞的潜在表征和伪标签进行训练,最终使用其进行细胞聚类。本发明对来自不同测序平台、不同物种、不同组织以及不同规模的细胞数据集都有很好的聚类结果。

    一种针对不平衡单细胞RNA-seq数据的细胞聚类方法、设备和介质

    公开(公告)号:CN118016167A

    公开(公告)日:2024-05-10

    申请号:CN202410085639.8

    申请日:2024-01-22

    Applicant: 中南大学

    Abstract: 本发明公开了一种针对不平衡单细胞RNA‑seq数据的细胞聚类方法、设备和介质,方法包括:获取聚类细胞的RNA‑seq数据,生成基因表达矩阵并预处理;利用基因表达矩阵计算各细胞间的相似度,选出近似细胞作为对比学习的附加增强正例;搭建对比学习模型,并利用各细胞的正例、附加增强正例和负例训练对比学习模型,以获取细胞潜在表征;基于细胞的潜在表征对所有细胞聚类,生成细胞的伪标签;基于细胞的潜在表征计算细胞间的距离值进而选择锚点细胞;搭建知识蒸馏模型,利用锚点细胞的潜在表征和伪标签进行训练,最终使用其进行细胞聚类。本发明对来自不同测序平台、不同物种、不同组织以及不同规模的细胞数据集都有很好的聚类结果。

Patent Agency Ranking