一种基于孤立森林算法的CNV检测方法、介质及设备

    公开(公告)号:CN118230825A

    公开(公告)日:2024-06-21

    申请号:CN202410416338.9

    申请日:2024-04-08

    Abstract: 本发明涉及基因测序技术领域,具体涉及一种基于孤立森林算法的CNV检测方法、介质及设备。方法包括从单细胞DNA测序的Bam文件中获取在参考基因组中引入CNV事件的基因组测序数据,采用可变窗口策略对参考基因组进行窗口划分,并通过一致的reads数量调整窗口得到分割位点信息文件,根据分割位点信息文件和基因组测序数据计算每个窗口内的RD信号值,并提取PEM信号得到PEM信号值,基于孤立森林算法对RD信号值和PEM信号值进行多特征计算分析,并根据分析结果对每个窗口进行CNV事件识别。本发明能够有效地识别单细胞DNA测序数据中的CNV事件,不仅克服了传统方法在单细胞DNA测序数据中的局限性,还提高了CNV事件检测的准确性和可靠性。

Patent Agency Ranking