-
公开(公告)号:CN118230825A
公开(公告)日:2024-06-21
申请号:CN202410416338.9
申请日:2024-04-08
Applicant: 西安交通大学
IPC: G16B30/10 , G16B30/20 , G16B40/00 , G06F18/23 , G06F18/243 , G06F18/2433 , G06N20/20
Abstract: 本发明涉及基因测序技术领域,具体涉及一种基于孤立森林算法的CNV检测方法、介质及设备。方法包括从单细胞DNA测序的Bam文件中获取在参考基因组中引入CNV事件的基因组测序数据,采用可变窗口策略对参考基因组进行窗口划分,并通过一致的reads数量调整窗口得到分割位点信息文件,根据分割位点信息文件和基因组测序数据计算每个窗口内的RD信号值,并提取PEM信号得到PEM信号值,基于孤立森林算法对RD信号值和PEM信号值进行多特征计算分析,并根据分析结果对每个窗口进行CNV事件识别。本发明能够有效地识别单细胞DNA测序数据中的CNV事件,不仅克服了传统方法在单细胞DNA测序数据中的局限性,还提高了CNV事件检测的准确性和可靠性。