一种基因组拷贝数变异的检测方法和装置

    公开(公告)号:CN111916150B

    公开(公告)日:2024-09-06

    申请号:CN201910389538.9

    申请日:2019-05-10

    Abstract: 本发明提供一种基因组拷贝数变异检测方法,所述方法包括:获取待测样品的基因组测序序列;将测序序列比对到人类基因组参考序列上,并确定唯一比对至基因组参考序列的位置;将基因组参考序列划分为等长窗口,统计落入每个窗口的唯一比对的测序序列数目,得到每个窗口的有效数据量;对每个窗口的有效数据量进行动态数据校正,得到每个窗口校正后的有效数据量;将校正后的有效数据量标准化,得到每个窗口的有效深度值;使用Fused Lasso算法过滤噪音,并通过对差分项的约束识别潜在的拷贝数变异区域;计算潜在的拷贝数变异区域内的拷贝数值(SCN),并与拷贝数的参考范围进行比较,得到准确的拷贝数变异检测结果。本发明还提供用于实施上述方法的装置和设备。本发明首次建立了计算拷贝数值SCN的数学模型,并确定了基因组区域拷贝数状态的参考区间。此外,本发明能有效地处理测序数据中的噪音,准确地识别拷贝数变异区域。

    一种基因组拷贝数变异的检测方法和装置

    公开(公告)号:CN111916150A

    公开(公告)日:2020-11-10

    申请号:CN201910389538.9

    申请日:2019-05-10

    Abstract: 本发明提供一种基因组拷贝数变异检测方法,所述方法包括:获取待测样品的基因组测序序列;将测序序列比对到人类基因组参考序列上,并确定唯一比对至基因组参考序列的位置;将基因组参考序列划分为等长窗口,统计落入每个窗口的唯一比对的测序序列数目,得到每个窗口的有效数据量;对每个窗口的有效数据量进行动态数据校正,得到每个窗口校正后的有效数据量;将校正后的有效数据量标准化,得到每个窗口的有效深度值;使用Fused Lasso算法过滤噪音,并通过对差分项的约束识别潜在的拷贝数变异区域;计算潜在的拷贝数变异区域内的拷贝数值(SCN),并与拷贝数的参考范围进行比较,得到准确的拷贝数变异检测结果。本发明还提供用于实施上述方法的装置和设备。本发明首次建立了计算拷贝数值SCN的数学模型,并确定了基因组区域拷贝数状态的参考区间。此外,本发明能有效地处理测序数据中的噪音,准确地识别拷贝数变异区域。

Patent Agency Ranking