-
公开(公告)号:CN118983006A
公开(公告)日:2024-11-19
申请号:CN202410993668.4
申请日:2024-07-23
Applicant: 清华大学
IPC: G16B40/00 , G16B40/20 , G06N3/084 , G06F18/25 , G06F18/241
Abstract: 一种多切片数据的处理方法、装置和介质,涉及生物技术领域,其中,方法包括:获取多个待处理切片的切片数据,切片数据包括对待处理切片进行空间染色质开放性测序得到的采样点‑峰区域矩阵和空间染色质开放性测序时采样点的坐标矩阵;根据全部待处理切片包含的峰区域之间的重合区域,将对应的切片数据融合,得到融合数据;基于融合数据构建训练样本,对预先构建的神经网络模型进行训练,得到训练后的神经网络模型;神经网络模型用于提取输入数据中的生物特征信息,并去除输入数据的批次效应,得到输入数据的共嵌入矩阵;从融合数据中提取目标切片对应的目标数据;将目标数据输入神经网络模型,得到目标切片的共嵌入矩阵。