-
公开(公告)号:CN116386725A
公开(公告)日:2023-07-04
申请号:CN202310279457.X
申请日:2023-03-21
Applicant: 南开大学
Abstract: 本发明属于计算机技术领域,提供了一种联合病理组学特征的肿瘤差异基因表达谱预测方法及系统。模型训练方法包括,根据数据病理切片数据,得到数字病理切片的特定肿瘤区域的细胞核特征谱;根据转录组学数据,得到队列基因表达矩阵;根据队列基因表达矩阵和患者临床信息,确定癌症组织和正常组织样本以及癌症样本的临床诊断分期,并进行基因差异表达分析,得到特定肿瘤的差异基因表达谱和特定肿瘤分期的差异基因表达谱;以数字病理切片的特定肿瘤区域的细胞核特征谱为输入,以该特定肿瘤的差异基因表达谱和该特定肿瘤分期的差异基因表达谱为输出,训练生成式模型。本发明极大降低了样本测序成本,提高后续诊断预后效率。
-
公开(公告)号:CN116364180A
公开(公告)日:2023-06-30
申请号:CN202310339311.X
申请日:2023-03-30
Applicant: 南开大学
IPC: G16B20/30 , G16B40/00 , G06F18/231
Abstract: 本发明涉及空间转录组测序数据分析技术领域,提供了一种基于空间转录组的细胞类型无偏定位方法及系统,包括:通过空间聚类方法,将空间转录组数据中的采样点划分为若干个类别;通过解卷积法,得到每个采样点的细胞类型比例,并将某个细胞类型在某个采样点中的比例,作为该细胞类型在该采样点处的富集分数;基于富集分数,筛选出具有空间异质性的细胞类型;对于每个具有空间异质性的细胞类型,基于富集分数筛选出具有空间异质性的采样点,得到一个空间异质性点集,并将所述空间异质性点集与所有组织区域进行匹配,得到最佳匹配组织区域。使得空间转录组中大部分的细胞类型能够找到其空间聚集模式,发现空间中的细胞类型共定位。
-
公开(公告)号:CN115798581A
公开(公告)日:2023-03-14
申请号:CN202211200712.9
申请日:2022-09-29
Applicant: 南开大学
IPC: G16B20/30 , G16B40/20 , G06N3/0464 , G06N3/048 , G06N3/08
Abstract: 本发明属于生物酶工程领域,提供了一种基于深度学习的酶改造的理性设计方法,包括构建蛋白质晶体结构数据集;基于蛋白质晶体结构数据集添加以氨基酸残基为中心的原子微环境,进行蛋白质晶体结构数据集重构;根据重构后的蛋白质晶体结构数据集,利用预先训练好的氨基酸残基预测模型对重构后的蛋白质晶体结构数据集进行氨基酸残基预测;根据预测的氨基酸残基概率与实际的天然酶的的氨基酸概率的差异程度,确定酶功能优化的潜在位点。本发明以蛋白质晶体结构数据作为基本数据集,充分利用里蛋白质的理化性质,基于人工智能对酶的进行理性设计与改造,避免了人工筛选带来的不便。
-
公开(公告)号:CN115273988A
公开(公告)日:2022-11-01
申请号:CN202210939726.6
申请日:2022-08-05
Applicant: 南开大学
Abstract: 本发明提出了一种交互式基因组浏览分析及可视化方法及系统,自动化生物信息学分析步骤,构建数据库构建及比对测序数据,交互式基因组比较和浏览可视化,能够针对用户输入的测序数据,提供了一种新的数据库用于基因组测序数据检索和比对,并且将多个方面的分析功能联系起来,进行定制的生物信息学分析,获得准确的分析结果。
-
公开(公告)号:CN113257364B
公开(公告)日:2022-07-12
申请号:CN202110578358.2
申请日:2021-05-26
Applicant: 南开大学
Abstract: 本公开提供了一种基于多目标进化的单细胞转录组测序数据聚类方法及系统,获取单细胞转录组测序数据;对获取的测序数据进行预处理;根据预处理后的测序数据,生成细胞间的距离矩阵;对得到的距离矩阵进行降维,得到多个降维结果;对每个降维结果进行k‑means聚类,得到多个聚类结果;对得到的聚类结果进行多目标的进化计算,得到多组进化计算后的聚类结果,每组进化计算后的聚类结果对应一个等价关系矩阵,取各个等价关系矩阵的平均值进行层次聚类得到最终的聚类结果;本公开通过对细胞间的距离矩阵进行降维和初步聚类,对初步聚类后的结果进行多目标进化计算,得到最终的聚类结果,增强了聚类结果的准确性和鲁棒性。
-
公开(公告)号:CN113257364A
公开(公告)日:2021-08-13
申请号:CN202110578358.2
申请日:2021-05-26
Applicant: 南开大学
Abstract: 本公开提供了一种基于多目标进化的单细胞转录组测序数据聚类方法及系统,获取单细胞转录组测序数据;对获取的测序数据进行预处理;根据预处理后的测序数据,生成细胞间的距离矩阵;对得到的距离矩阵进行降维,得到多个降维结果;对每个降维结果进行k‑means聚类,得到多个聚类结果;对得到的聚类结果进行多目标的进化计算,得到多组进化计算后的聚类结果,每组进化计算后的聚类结果对应一个等价关系矩阵,取各个等价关系矩阵的平均值进行层次聚类得到最终的聚类结果;本公开通过对细胞间的距离矩阵进行降维和初步聚类,对初步聚类后的结果进行多目标进化计算,得到最终的聚类结果,增强了聚类结果的准确性和鲁棒性。
-
公开(公告)号:CN113205856A
公开(公告)日:2021-08-03
申请号:CN202110693173.6
申请日:2021-06-22
Applicant: 南开大学
Abstract: 本公开提供了一种微生物宏基因组分箱方法及系统,包括:获取待分箱的微生物宏基因组序列;对所述宏基因组序列中每条序列进行特征提取,将提取的特征输入VAE‑GAN神经网络中进行训练,通过训练将提取的特征编码到VAE隐含向量中;基于所述VAE隐含向量中的均值变量,对所述宏基因组序列进行聚类,实现宏基因组的分箱;相对于现有方法,本公开所述方案采用了多种特征融合的方式,对宏基因组的序列特征进行深度挖掘,实现了对宏基因组序列的精确描述,同时,为了提高算法的处理效率,利用VAE‑GAN神经网络对所提取的特征进行特征降维,所述降维方法在降低特征维度的同时,充分保留了序列特征中的必要成分,良好的平衡了分箱精度与分箱时间的关系。
-
公开(公告)号:CN112133368A
公开(公告)日:2020-12-25
申请号:CN202011090802.8
申请日:2020-10-13
Applicant: 南开大学
Abstract: 本发明公开了一种基于三代测序技术的宏基因组测序数据自动化分析方法,包括以下步骤:1)原始三代测序数据进行质量控制,得到clean reads;2)对clean reads拼接组装得到contigs序列;3)对contigs进行纠错优化;4)对优化后的contigs进行物种注释;5)基于物种丰度矩阵对样本多样性进行统计分析;6)基于物种丰度矩阵对样本组间差异显著物种进行统计分析;7)对优化后的contigs进行分箱;8)对分箱得到的bins进行基因注释;9)基于基因丰度矩阵对样本组间差异显著基因进行统计分析;10)基于基因注释结果,完成功能注释以及物种注释;本发明提供了从三代宏基因组测序数据处理到物种组成分析、基因组成分析与功能注释的分析方法,解决了宏基因组数据自动化精准分析难题。
-
公开(公告)号:CN112071366A
公开(公告)日:2020-12-11
申请号:CN202011089931.5
申请日:2020-10-13
Applicant: 南开大学
Abstract: 本发明公开了一种基于二代测序技术的宏基因组数据分析方法,包括以下步骤:1)对原始测序数据进行质量控制,得到clean reads;2)对质量控制后的clean reads进行物种注释;3)基于物种丰度矩阵对样本多样性进行统计分析;4)基于物种丰度矩阵对样本组间差异显著物种进行统计分析;5)对clean reads拼接组装得到contigs序列;6)对拼接组装得到的contigs分箱,得到bins;7)对分箱后的bins进行基因注释;8)基于基因丰度矩阵对样本组间差异显著基因进行统计分析;9)基于基因注释结果,对序列进行功能及物种注释;提供了从宏基因组二代测序数据处理到物种组成分析、基因组成分析与功能注释的全部流程,为研究人员提供准确的分析结果、全面解析宏基因组学问题。
-
公开(公告)号:CN114944193B
公开(公告)日:2024-10-29
申请号:CN202210552093.3
申请日:2022-05-20
Applicant: 南开大学
Abstract: 本发明提出了整合单细胞转录组与空间转录组数据的分析方法及系统,包括:获取空间转录组数据,对空间转录组数据进行预处理;通过聚类方法将空间转录组数据中的采样点划分为若干个类别,每一个类别表示组织切片图像中一个组织区域;根据去污染后的空间基因表达数据,和空间聚类步骤的结果,筛选出在空间中具有差异性表达的基因;根据输入的单细胞数据进行分析,基于筛选出在空间中具有差异性表达的基因得出每个细胞亚群的表达模式;根据单细胞数据集中的细胞亚群表达模式,将所有spot的基因表达作为输入,获得细胞类型在各个组织区域中的分布。
-
-
-
-
-
-
-
-
-