-
公开(公告)号:CN116875684A
公开(公告)日:2023-10-13
申请号:CN202310842752.1
申请日:2023-07-10
Applicant: 清华大学
IPC: C12Q1/6883 , G01N33/68 , G16H50/20 , G16B20/30
Abstract: 本发明涉及生物医学技术领域,具体涉及一组用于识别不稳定动脉粥样硬化斑块的生物标志物及其应用。通过斑块形成阶段开始出现、具有特定分子特征、且具有较高易损风险的细胞群筛选出一组用于识别不稳定动脉粥样硬化斑块的生物标志物,其可应用到不良心脑血管事件的早期预警及诊断中,临床应用前景良好。
-
公开(公告)号:CN112820407B
公开(公告)日:2022-06-17
申请号:CN202110021990.7
申请日:2021-01-08
Applicant: 清华大学
Abstract: 本发明公开了一种利用血浆游离核酸检测癌症的深度学习方法和系统,其中,方法包括以下步骤:通过使用核酸分子级别分辨率的甲基化状态数据定义癌症特异的差异甲基化区间,从而达到富集分子分辨率级别的信息的效果;使用深度学习模型整合核酸分子的序列信息以及甲基化信息从而达成精确的核酸分子来源预测;通过计算最大后验概率的方式估计血浆中来自癌症的核酸序列片段占比,从而起到癌症的非侵入式辅助诊断的效果。将本发明的方法应用于癌症检测中,能够在非常低深度的测序数据上达到稳定的预测效果,从而在降低检测成本的同时保证足够的灵敏性与准确性。
-
公开(公告)号:CN112820407A
公开(公告)日:2021-05-18
申请号:CN202110021990.7
申请日:2021-01-08
Applicant: 清华大学
Abstract: 本发明公开了一种利用血浆游离核酸检测癌症的深度学习方法和系统,其中,方法包括以下步骤:通过使用核酸分子级别分辨率的甲基化状态数据定义癌症特异的差异甲基化区间,从而达到富集分子分辨率级别的信息的效果;使用深度学习模型整合核酸分子的序列信息以及甲基化信息从而达成精确的核酸分子来源预测;通过计算最大后验概率的方式估计血浆中来自癌症的核酸序列片段占比,从而起到癌症的非侵入式辅助诊断的效果。将本发明的方法应用于癌症检测中,能够在非常低深度的测序数据上达到稳定的预测效果,从而在降低检测成本的同时保证足够的灵敏性与准确性。
-
公开(公告)号:CN116580771A
公开(公告)日:2023-08-11
申请号:CN202310183933.8
申请日:2023-02-20
Applicant: 清华大学
Abstract: 本申请涉及一种预测肿瘤新抗原的方法和装置,方法包括:获取受试者的肿瘤突变肽的序列信息以及MHC等位基因型信息;根据各肿瘤突变肽的序列和MHC等位基因型计算各肿瘤突变肽的MHC结合参数,根据MHC结合参数对肿瘤突变肽进行筛选得到候选肿瘤新抗原;基于预设指标对候选肿瘤新抗原进行分组,按照MHC结合参数对分组后的候选肿瘤新抗原进行排序以确定目标肿瘤新抗原,其中,预设指标包括野生肽差异度以及IEDB抗原相似度。本申请创造性地通过野生肽差异度以及IEDB抗原相似度对质控后的肿瘤新抗原进行排序,提高了筛选新抗原的准确性,提升了肿瘤免疫疗法设计的灵活性与效能。
-
公开(公告)号:CN116052765A
公开(公告)日:2023-05-02
申请号:CN202310100892.1
申请日:2023-01-18
Applicant: 清华大学
IPC: G16B20/00 , G16B40/00 , G16B30/20 , G06N3/049 , G06N3/0442 , G06N3/045 , G06N3/0475 , G06N3/094
Abstract: 本发明公开了一种基于局部序列约束的启动子智能设计方法、装置及应用。本发明中的方法利用“侧翼序列填充”的知识‑模型共驱动学习策略来实现,将已有天然启动子的复杂调控规律利用数据进行学习,使用条件生成对抗网络生成基因调控元件生成模型,并根据先验序列优化其侧翼区域。通过遗传算法和DenseNet结构的预测模型对生成器生成的序列进行迭代优化,最终得到基于先验知识约束的条件式基因调控元件。本发明可用于高效快速的基因元件的设计;用于组成型或诱导型启动子的设计。经检测使用本发明的方法设计的组成型启动子具有高调控表达性能,所设计的诱导型启动子具有高诱导率,其调控性能超过已知天然与合成元件。
-
公开(公告)号:CN118016163A
公开(公告)日:2024-05-10
申请号:CN202410058238.3
申请日:2024-01-15
Applicant: 清华大学
IPC: G16B40/00 , G16B25/10 , G06N3/084 , G06N3/0455
Abstract: 本发明涉及生物信息学技术领域,公开一种单细胞生成式预训练基础模型的构建方法及其应用,包括:得到细胞的基因表达数据和元数据,并利用二元组的形式表示基因表达数据和元数据,得到第一二元组和第二二元组;根据预设任务提示词,将第一二元组和第二二元组进行连接,得到若干携带预设任务提示词的细胞句子;根据携带预设任务提示词的细胞句子,进行生成式建模,利用深度神经网络学习基因之间的表达依赖关系,得到单细胞生成式预训练基础模型。本发明充分利用元数据,通过生成式建模,利用深度神经网络,实现通用基因调控的理解;利用预设任务提示词对二元组进行有组织的连接、排列,使模型能够通过预设任务提示词独立、高效地完成各项任务。
-
公开(公告)号:CN113782088A
公开(公告)日:2021-12-10
申请号:CN202110853135.2
申请日:2021-07-27
Applicant: 清华大学
Abstract: 本申请提出一种microRNA感受器序列的设计方法和装置,其中,方法包括:获得microRNA感受器所处于的细胞环境内的microRNA和RNA,根据microRNA和RNA获得竞争性RNA;其中,竞争性RNA是基于microRNA和RNA相互作用的强度,计算出每一种microRNA所调控的RNA在不同相互作用强度的数量;按照RNA所含竞争性RNA的相互作用强弱,从RNA中确定出不同强度的竞争性RNA,计算获得microRNA的噪声调控能力值;根据预期获得表达噪声的第一预设阈值,以根据第二预设阈值选取具有特定噪声调控能力值的microRNA设计靶位点,并对microRNA调控的靶位点进行设计,以定向调整所述表达噪声。本发明可以准确地基于细胞的状态和需求的基因表达值调高或调低基因表达噪声,在合成生物学中具有广泛的工程应用价值。
-
公开(公告)号:CN118398089A
公开(公告)日:2024-07-26
申请号:CN202410023244.5
申请日:2024-01-05
Applicant: 清华大学
Abstract: 本申请涉及生物信息学技术领域,特别涉及一种细胞状态迁移过程中的驱动因子识别方法、装置及设备,其中,方法包括:根据单细胞多组学数据推断基因的调控网络;恢复并增强调控网络中转录因子与基因的调控关系得到增强网络矩阵,根据增强网络矩阵和细胞状态的真实迁移向量确定转录因子的变化向量;根据调控网络和变化向量确定细胞状态的推断迁移向量,根据真实迁移向量和推断迁移向量识别转录因子中的驱动因子。由此,解决了相关技术中使用细胞群体测序数据而引入组织异质性,导致转录因子的识别效果较差等问题。
-
公开(公告)号:CN118173180A
公开(公告)日:2024-06-11
申请号:CN202211570786.1
申请日:2022-12-08
Applicant: 清华大学
IPC: G16B45/00
Abstract: 本发明提供一种单细胞转录组分析系统,涉及细胞技术领域。包括数据管理模块、动态内存调用模块、自动分析模块和格式转换模块;数据管理模块与动态内存调用模块、自动分析模块和格式转换模块分别连接,用于管理单细胞转录组分析系统中的单细胞组学原始数据等;动态内存调用模块与自动分析模块相连接,用于管理数据在计算机内存中的载入和清出;自动分析模块用于自动构建可视化和可交互的单细胞分析流程,并根据分析流程执行分析算法;格式转换模块用于将所述单细胞转录组分析系统的数据格式与其他外部系统的数据格式进行互相转换。本发明实施例提供的系统能够兼顾自动化程度和分析流程的灵活性。
-
公开(公告)号:CN117649882A
公开(公告)日:2024-03-05
申请号:CN202311548915.1
申请日:2023-11-20
Applicant: 清华大学
IPC: G16B40/00
Abstract: 本发明涉及生物信息技术领域,公开一种Perturb‑seq实验的成本分析方法及系统,包括:根据目标gRNA信息和目标基因信息,得到目标gRNA的感染效率、目标gRNA对目标基因的扰动数据、预设显著水平数据、和预设功效数据,估算用于检测目标基因受到目标gRNA的影响的细胞数量;根据估算得到的细胞数量,进行实验成本分析和gRNA比例分析,得到优化实验方案。本发明估算得到的细胞数量既有利于实验人员进行实验,又能够进行实验成本分析,当用户认为实验成本过高时可以对细胞数量进行适量删减,当目标gRNA为多个时,还可以优化gRNA比例分配,以降低实验成本,避免浪费生物资源,提高实验效率。
-
-
-
-
-
-
-
-
-