一种与细胞通讯相关高度可变基因的识别方法

    公开(公告)号:CN120032714A

    公开(公告)日:2025-05-23

    申请号:CN202311550340.7

    申请日:2023-11-21

    Abstract: 本发明公开提供一种与细胞通讯相关高度可变基因的识别方法,属于生物信息学领域,该方法对单细胞RNA测序(scRNA‑seq)数据和空间转录组学(ST)数据进行特征提取,然后使用Seurat的函数对scRNA‑seq数据中的基因表达信息和ST数据中的空间细胞坐标信息进行筛选和提取,并对基因表达信息进行主成分分析。从而使用多元线性回归模型CPPLS对这两种信息进行拟合,构建出细胞通讯网络。首先先将细胞通讯网络中的基因表达水平与人类基因组和小鼠基因组的表达水平进行对比,得到细胞通讯对基因表达的影响。后续使用有向图的特征,对数据集中每两种细胞类型之间的关系进行分析,并且基于GeneCards、GO等官方数据库中记录的基因功能,为参与细胞网络构建的基因打标签,最后基于标签使用神经网络模型MLP对基因进行预测和分类,即可以识别与细胞通讯相关高度可变基因;该方法综合了单细胞及空间转录组学数据的信息,并且基于先验知识的准确性,因此可以精确识别与细胞通讯相关高度可变基因。

Patent Agency Ranking