-
公开(公告)号:CN117854600B
公开(公告)日:2024-05-21
申请号:CN202410259151.2
申请日:2024-03-07
Applicant: 北京大学
Inventor: 荣志炜
IPC: G16B40/00 , G06F18/2431 , G06F18/23 , G06F18/25 , G06N3/042 , G06N3/0455 , G06N3/0895
Abstract: 本发明涉及细胞组学技术领域,公开了一种基于多组学数据的细胞识别方法、装置、设备及存储介质,该方法包括:获取若干个单细胞样本对应的样本多组学数据;在样本多组学数据中存在目标细胞状态注释时,基于目标细胞状态注释,通过预设单细胞镶嵌集成模型确定单细胞样本中各单细胞的细胞类型注释;基于细胞类型注释确定单细胞样本对应的细胞类型识别结果。本发明可以在单细胞样本对应的样本多组学数据存在目标细胞状态注释时,通过预设单细胞镶嵌集成模型确定各单细胞的细胞类型注释,以获得细胞类型识别结果,解决了现有技术中通过单细胞转录组学数据整合方式对单细胞多组学数据进行整合以进行细胞识别时,细胞识别的准确度不高的技术问题。
-
公开(公告)号:CN117854600A
公开(公告)日:2024-04-09
申请号:CN202410259151.2
申请日:2024-03-07
Applicant: 北京大学
Inventor: 荣志炜
IPC: G16B40/00 , G06F18/2431 , G06F18/23 , G06F18/25 , G06N3/042 , G06N3/0455 , G06N3/0895
Abstract: 本发明涉及细胞组学技术领域,公开了一种基于多组学数据的细胞识别方法、装置、设备及存储介质,该方法包括:获取若干个单细胞样本对应的样本多组学数据;在样本多组学数据中存在目标细胞状态注释时,基于目标细胞状态注释,通过预设单细胞镶嵌集成模型确定单细胞样本中各单细胞的细胞类型注释;基于细胞类型注释确定单细胞样本对应的细胞类型识别结果。本发明可以在单细胞样本对应的样本多组学数据存在目标细胞状态注释时,通过预设单细胞镶嵌集成模型确定各单细胞的细胞类型注释,以获得细胞类型识别结果,解决了现有技术中通过单细胞转录组学数据整合方式对单细胞多组学数据进行整合以进行细胞识别时,细胞识别的准确度不高的技术问题。
-
公开(公告)号:CN117334347B
公开(公告)日:2024-03-22
申请号:CN202311632339.9
申请日:2023-12-01
Applicant: 北京大学
IPC: G16H50/70 , G16H70/40 , G06N3/0455
Abstract: 本发明涉及数据处理技术领域,公开了一种评估治疗效果方法、装置、设备及存储介质,该方法包括:对临床试验数据和外部真实世界数据进行预处理,获得研究数据集;将研究数据集输入至预设自编码神经网络模型,获得研究数据集中每一个患者的潜在特征;根据临床试验患者的潜在特征对应的特征评分从研究数据集中选取目标外部真实世界患者数据,并将临床试验数据和目标外部真实世界患者数据进行分层,获得分层结果;利用复合似然方法对分层结果进行数据分析,获得当前临床研究药物的治疗效果值。解决了现有技术中由于协变量的增加而产生的复杂性,进而提高了治疗效果评估的准确性。
-
公开(公告)号:CN119474650B
公开(公告)日:2025-05-16
申请号:CN202510054052.5
申请日:2025-01-14
Applicant: 北京大学
Inventor: 荣志炜
Abstract: 本申请公开了一种基于期望最大化迭代的生物标志物聚合方法,本申请涉及医学数据处理技术领域,该方法包括:获取来自多个数据源的生物标志物对应的本地测量值;对生物标志物进行抽样测定,获得参考测量值;根据参考测量值和本地测量值执行期望最大化迭代算法,获得目标估计参数;目标估计参数表征生物标志物对应的效应影响。本申请首先对部分生物标志物进行测定,获得不受批次效应影响的参考测量值后,通过期望最大化算法基于参考测量值、本地测量值进行循环迭代,最终获得生物标志物与疾病结局之间有效的目标估计参数,从而实现对来自多个数据源的生物标志物的有效聚合。
-
公开(公告)号:CN117877590A
公开(公告)日:2024-04-12
申请号:CN202410277588.9
申请日:2024-03-12
Applicant: 北京大学
Inventor: 荣志炜
IPC: G16B40/00 , G16B25/00 , G16B30/00 , G16B35/20 , G06F18/214 , G06F18/23 , G06F18/27 , G06N3/0895
Abstract: 本发明涉及细胞技术领域,尤其涉及一种基于测序数据的细胞聚类方法、装置、设备及存储介质,该方法包括:获得单细胞组对应的单细胞总数;将分离的每个单细胞转录扩增获得单细胞转录组;将单细胞转录组测序得到的测序数据集预处理获得分析数据集;通过预设单细胞数据聚类模型对分析数据集进行聚类分析,获得聚类结果,预设单细胞数据聚类模型通过自缩放注意力机制进行半监督学习。由于本发明对单细胞转录组进行测序得到测序数据集,通过预设单细胞数据聚类模型的自缩放注意力机制对测序数据集进行聚类分析,避免了传统的单细胞聚类的结果存在边界不清晰的情况,可明确细胞的聚类,能够对细胞进行很好的区分,从而实现了更准确的细胞聚类效果。
-
公开(公告)号:CN117854599A
公开(公告)日:2024-04-09
申请号:CN202410259150.8
申请日:2024-03-07
Applicant: 北京大学
Inventor: 荣志炜
IPC: G16B40/00 , G16B30/00 , G06F18/2431 , G06F18/213 , G06F18/25 , G06N3/042 , G06N3/0455 , G06N3/0895
Abstract: 本发明涉及细胞组学技术领域,公开一种多模态细胞数据的批次效应处理方法、设备及存储介质,该方法包括:获取单个细胞的组学数据;将组学数据输入至预设单细胞数据整合模型,获得对应组学数据的模态特征生成结果,预设单细胞数据整合模型包括:自缩放注意力融合模块,用于对各模态单元的组学数据对应的模态特征进行融合,获得全局特征,并将全局特征输入至混合解码模块以使混合解码模块进行特征映射,获得模态特征分布参数;根据模态生成结果获得的单个细胞的多组学整合数据集。由于本发明预设单细胞数据整合模型中包括自缩放注意力模块,能够适应多模态的组学数据,实现对组学数据中各模态特征的准确分析,在数据整合中降低批次效应的影响。
-
公开(公告)号:CN117312881B
公开(公告)日:2024-03-22
申请号:CN202311600090.3
申请日:2023-11-28
Applicant: 北京大学
IPC: G06F18/22 , G16H10/20 , G06F18/2323
Abstract: 本发明涉及数据处理技术领域,公开了一种临床试验治疗效果评估方法、装置、设备及存储介质,该方法包括:确定用于表征当前临床试验数据源和真实世界数据源之间的相似度的倾向性评分;基于倾向性评分和预设层次聚类模型构建层次聚类树;基于高斯过程方法、层次聚类树以及各真实世界数据源对应的借用信息确定临床治疗效果值。本发明基于倾向性评分和预设层次聚类模型构建层次聚类树,并基于层次聚类树和各真实世界数据源对应的借用信息确定临床治疗效果值,解决了获取真实世界数据中借用信息对应的治疗效果的方法不能扩展到多个RWD源,需要计算限制借用样本量,实用性不高的问题。
-
公开(公告)号:CN117334347A
公开(公告)日:2024-01-02
申请号:CN202311632339.9
申请日:2023-12-01
Applicant: 北京大学
IPC: G16H50/70 , G16H70/40 , G06N3/0455
Abstract: 本发明涉及数据处理技术领域,公开了一种评估治疗效果方法、装置、设备及存储介质,该方法包括:对临床试验数据和外部真实世界数据进行预处理,获得研究数据集;将研究数据集输入至预设自编码神经网络模型,获得研究数据集中每一个患者的潜在特征;根据临床试验患者的潜在特征对应的特征评分从研究数据集中选取目标外部真实世界患者数据,并将临床试验数据和目标外部真实世界患者数据进行分层,获得分层结果;利用复合似然方法对分层结果进行数据分析,获得当前临床研究药物的治疗效果值。解决了现有技术中由于协变量的增加而产生的复杂性,进而提高了治疗效果评估的准确性。
-
公开(公告)号:CN117877590B
公开(公告)日:2024-05-28
申请号:CN202410277588.9
申请日:2024-03-12
Applicant: 北京大学
Inventor: 荣志炜
IPC: G16B40/00 , G16B25/00 , G16B30/00 , G16B35/20 , G06F18/214 , G06F18/23 , G06F18/27 , G06N3/0895
Abstract: 本发明涉及细胞技术领域,尤其涉及一种基于测序数据的细胞聚类方法、装置、设备及存储介质,该方法包括:获得单细胞组对应的单细胞总数;将分离的每个单细胞转录扩增获得单细胞转录组;将单细胞转录组测序得到的测序数据集预处理获得分析数据集;通过预设单细胞数据聚类模型对分析数据集进行聚类分析,获得聚类结果,预设单细胞数据聚类模型通过自缩放注意力机制进行半监督学习。由于本发明对单细胞转录组进行测序得到测序数据集,通过预设单细胞数据聚类模型的自缩放注意力机制对测序数据集进行聚类分析,避免了传统的单细胞聚类的结果存在边界不清晰的情况,可明确细胞的聚类,能够对细胞进行很好的区分,从而实现了更准确的细胞聚类效果。
-
公开(公告)号:CN117312881A
公开(公告)日:2023-12-29
申请号:CN202311600090.3
申请日:2023-11-28
Applicant: 北京大学
IPC: G06F18/22 , G16H10/20 , G06F18/2323
Abstract: 本发明涉及数据处理技术领域,公开了一种临床试验治疗效果评估方法、装置、设备及存储介质,该方法包括:确定用于表征当前临床试验数据源和真实世界数据源之间的相似度的倾向性评分;基于倾向性评分和预设层次聚类模型构建层次聚类树;基于高斯过程方法、层次聚类树以及各真实世界数据源对应的借用信息确定临床治疗效果值。本发明基于倾向性评分和预设层次聚类模型构建层次聚类树,并基于层次聚类树和各真实世界数据源对应的借用信息确定临床治疗效果值,解决了获取真实世界数据中借用信息对应的治疗效果的方法不能扩展到多个RWD源,需要计算限制借用样本量,实用性不高的问题。
-
-
-
-
-
-
-
-
-