-
公开(公告)号:CN113257364B
公开(公告)日:2022-07-12
申请号:CN202110578358.2
申请日:2021-05-26
Applicant: 南开大学
Abstract: 本公开提供了一种基于多目标进化的单细胞转录组测序数据聚类方法及系统,获取单细胞转录组测序数据;对获取的测序数据进行预处理;根据预处理后的测序数据,生成细胞间的距离矩阵;对得到的距离矩阵进行降维,得到多个降维结果;对每个降维结果进行k‑means聚类,得到多个聚类结果;对得到的聚类结果进行多目标的进化计算,得到多组进化计算后的聚类结果,每组进化计算后的聚类结果对应一个等价关系矩阵,取各个等价关系矩阵的平均值进行层次聚类得到最终的聚类结果;本公开通过对细胞间的距离矩阵进行降维和初步聚类,对初步聚类后的结果进行多目标进化计算,得到最终的聚类结果,增强了聚类结果的准确性和鲁棒性。
-
公开(公告)号:CN113345535A
公开(公告)日:2021-09-03
申请号:CN202110626082.0
申请日:2021-06-04
Applicant: 南开大学
IPC: G16C20/50
Abstract: 本发明提供一种保持药物化学性质与功能一致性的药物靶标预测方法及系统,属于计算机辅助药物研发技术领域,获取待预测的药物的化学指纹;利用训练好的特征选择模型,对药物的化学指纹进行处理,得到药物与靶标的相互作用评分矩阵;基于药物与靶标的相互作用评分矩阵,将评分最高的对应靶标,作为该药物的作用靶标。本发明同时考虑药物的化学属性和临床功能,预测药物的可能靶标;将药物的特征向量先投影到蛋白空间,再投影到疾病空间,将药物‑靶标相互作用预测任务由传统单标签分类任务改为了多标签任务,考虑了药物与蛋白质之间复杂的容斥关系;通过保持药物化学相似性、功能相似性的一致性,保持了药物化学性质、分子机制与临床功能的一致性。
-
公开(公告)号:CN113257364A
公开(公告)日:2021-08-13
申请号:CN202110578358.2
申请日:2021-05-26
Applicant: 南开大学
Abstract: 本公开提供了一种基于多目标进化的单细胞转录组测序数据聚类方法及系统,获取单细胞转录组测序数据;对获取的测序数据进行预处理;根据预处理后的测序数据,生成细胞间的距离矩阵;对得到的距离矩阵进行降维,得到多个降维结果;对每个降维结果进行k‑means聚类,得到多个聚类结果;对得到的聚类结果进行多目标的进化计算,得到多组进化计算后的聚类结果,每组进化计算后的聚类结果对应一个等价关系矩阵,取各个等价关系矩阵的平均值进行层次聚类得到最终的聚类结果;本公开通过对细胞间的距离矩阵进行降维和初步聚类,对初步聚类后的结果进行多目标进化计算,得到最终的聚类结果,增强了聚类结果的准确性和鲁棒性。
-
公开(公告)号:CN113205856A
公开(公告)日:2021-08-03
申请号:CN202110693173.6
申请日:2021-06-22
Applicant: 南开大学
Abstract: 本公开提供了一种微生物宏基因组分箱方法及系统,包括:获取待分箱的微生物宏基因组序列;对所述宏基因组序列中每条序列进行特征提取,将提取的特征输入VAE‑GAN神经网络中进行训练,通过训练将提取的特征编码到VAE隐含向量中;基于所述VAE隐含向量中的均值变量,对所述宏基因组序列进行聚类,实现宏基因组的分箱;相对于现有方法,本公开所述方案采用了多种特征融合的方式,对宏基因组的序列特征进行深度挖掘,实现了对宏基因组序列的精确描述,同时,为了提高算法的处理效率,利用VAE‑GAN神经网络对所提取的特征进行特征降维,所述降维方法在降低特征维度的同时,充分保留了序列特征中的必要成分,良好的平衡了分箱精度与分箱时间的关系。
-
公开(公告)号:CN112133368A
公开(公告)日:2020-12-25
申请号:CN202011090802.8
申请日:2020-10-13
Applicant: 南开大学
Abstract: 本发明公开了一种基于三代测序技术的宏基因组测序数据自动化分析方法,包括以下步骤:1)原始三代测序数据进行质量控制,得到clean reads;2)对clean reads拼接组装得到contigs序列;3)对contigs进行纠错优化;4)对优化后的contigs进行物种注释;5)基于物种丰度矩阵对样本多样性进行统计分析;6)基于物种丰度矩阵对样本组间差异显著物种进行统计分析;7)对优化后的contigs进行分箱;8)对分箱得到的bins进行基因注释;9)基于基因丰度矩阵对样本组间差异显著基因进行统计分析;10)基于基因注释结果,完成功能注释以及物种注释;本发明提供了从三代宏基因组测序数据处理到物种组成分析、基因组成分析与功能注释的分析方法,解决了宏基因组数据自动化精准分析难题。
-
公开(公告)号:CN112071366A
公开(公告)日:2020-12-11
申请号:CN202011089931.5
申请日:2020-10-13
Applicant: 南开大学
Abstract: 本发明公开了一种基于二代测序技术的宏基因组数据分析方法,包括以下步骤:1)对原始测序数据进行质量控制,得到clean reads;2)对质量控制后的clean reads进行物种注释;3)基于物种丰度矩阵对样本多样性进行统计分析;4)基于物种丰度矩阵对样本组间差异显著物种进行统计分析;5)对clean reads拼接组装得到contigs序列;6)对拼接组装得到的contigs分箱,得到bins;7)对分箱后的bins进行基因注释;8)基于基因丰度矩阵对样本组间差异显著基因进行统计分析;9)基于基因注释结果,对序列进行功能及物种注释;提供了从宏基因组二代测序数据处理到物种组成分析、基因组成分析与功能注释的全部流程,为研究人员提供准确的分析结果、全面解析宏基因组学问题。
-
公开(公告)号:CN110400164A
公开(公告)日:2019-11-01
申请号:CN201910395481.3
申请日:2019-05-13
Applicant: 腾讯科技(北京)有限公司 , 南开大学
Abstract: 本发明公开了一种数据确定方法和装置、存储介质及电子装置。其中,该方法包括:获取基于数据投放平台投放的目标资源执行操作所生成的操作数据;使用与第一加密算法匹配的密钥对操作数据进行加密处理,得到第一加密操作数据;将第一加密操作数据发送给数据投放平台,并获取数据投放平台返回的第二加密操作数据和第一目标数据;对第二加密操作数据进行解密处理,得到第二目标数据;获取第一目标数据及第二目标数据之间的交集;根据交集确定与目标资源相匹配的资源转化率。本发明解决了相关技术提供的数据确定方法容易泄露数据导致难以保证数据安全性的技术问题。
-
公开(公告)号:CN114944193B
公开(公告)日:2024-10-29
申请号:CN202210552093.3
申请日:2022-05-20
Applicant: 南开大学
Abstract: 本发明提出了整合单细胞转录组与空间转录组数据的分析方法及系统,包括:获取空间转录组数据,对空间转录组数据进行预处理;通过聚类方法将空间转录组数据中的采样点划分为若干个类别,每一个类别表示组织切片图像中一个组织区域;根据去污染后的空间基因表达数据,和空间聚类步骤的结果,筛选出在空间中具有差异性表达的基因;根据输入的单细胞数据进行分析,基于筛选出在空间中具有差异性表达的基因得出每个细胞亚群的表达模式;根据单细胞数据集中的细胞亚群表达模式,将所有spot的基因表达作为输入,获得细胞类型在各个组织区域中的分布。
-
公开(公告)号:CN114944194B
公开(公告)日:2024-09-20
申请号:CN202210552099.0
申请日:2022-05-20
Applicant: 南开大学
Abstract: 本发明公开了一种推断空间转录组内细胞亚群表达模式的方法及系统,涉及生物信息学空间转录组测序数据分析技术领域。本发明包括对scRNA‑seq数据集进行质量控制和预处理,得到细胞亚群表达矩阵;对细胞亚群表达矩阵进行标准化和归一化;构建变分神经网络,以学习scRNA‑seq数据集中每个细胞亚群的隐变量分布;在训练好的隐变量分布中进行采样,生成细胞亚群的表达模式;基于所述的细胞亚群的表达模式,对空间转录组组织切片中所有空间域的表达模式进行解卷积,得到细胞亚群在空间域中分布的最大后验估计。本发明使空间转录组中解卷积法所需单细胞参考数据在降低维度的同时,保留大量有关信息,提高解卷积方法的运行速度和准确性,使细胞在组织切片内的分布更加精确。
-
公开(公告)号:CN118098342A
公开(公告)日:2024-05-28
申请号:CN202410249959.2
申请日:2024-03-05
Applicant: 南开大学
IPC: G16B15/30
Abstract: 本发明涉及合成生物学基因编辑技术领域,提供了一种CRISPR脱靶效应预测方法与系统。该方法包括,获取中靶脱靶序列对、中靶序列和脱靶序列;对中靶脱靶序列对、中靶序列和脱靶序列均进行词嵌入编码和位置编码处理,得到中靶脱靶序列对特征、中靶序列特征和脱靶序列特征;将中靶脱靶序列对特征、中靶序列特征和脱靶序列特征分别输入到三个网络分支中进行特征提取,得到第一特征、第二特征和第三特征;将第一特征、第二特征和第三特征进行融合,经全连接层,得到预测值。
-
-
-
-
-
-
-
-
-