校正测序数据、检测拷贝数变异的方法、设备和介质

    公开(公告)号:CN114792548B

    公开(公告)日:2022-09-09

    申请号:CN202210663961.5

    申请日:2022-06-14

    Abstract: 本发明涉及一种校正测序数据、检测拷贝数变异的方法、设备和介质。该方法包括:计算每一条唯一比对上的读长在参考基因组中的位置和每个位置被测序到的次数;将基因组按照预定长度的窗口进行划分,以便统计每一个窗口内比对上的读长数目;针对每一个窗口内的比对上的读长数目进行GC校正,生成经由窗口层面的GC校正的每个窗口的唯一比对数;基于染色体层面的唯一比对数占比,获得唯一比对数占比调整比例,以便生成经由染色体层面的GC校正的每个窗口的唯一比对数;以及针对经由染色体层面的GC校正的每个窗口的唯一比对数进行归一化,以便获得经由归一化和GC校正的每个窗口的唯一比对数。本发明能显著提高针对高GC含量的区域的校正效果。

    检测基因组结构变异的方法、计算设备和存储介质

    公开(公告)号:CN112669902B

    公开(公告)日:2021-06-04

    申请号:CN202110278208.X

    申请日:2021-03-16

    Inventor: 杨旗 张钰 孙怀玉

    Abstract: 本发明提供了一种用于检测基因组SV的方法、计算设备和计算机可读存储介质。该方法包括:基于基因组的测序序列的SV信号构建断点末端区间图;为断点末端区间图的每条边构建一个断点末端图并且确定一个或多个断点末端列表;对每个断点末端列表推测第一候选SV;对每个断点末端列表的测序序列进行局部组装以获取局部组装序列集合,并且检测第二候选SV集合;响应于确定第一候选SV包含于第二候选SV集合中,将第二候选SV集合确定为候选SV集合;响应于确定第一候选SV不包含于第二候选SV集合中,将第一候选SV和第二候选SV集合的并集确定为候选SV集合;以及基于所有断点末端列表的所有候选SV集合确定基因组SV。

    检测基因组结构变异的方法、计算设备和存储介质

    公开(公告)号:CN112669902A

    公开(公告)日:2021-04-16

    申请号:CN202110278208.X

    申请日:2021-03-16

    Inventor: 杨旗 张钰 孙怀玉

    Abstract: 本发明提供了一种用于检测基因组SV的方法、计算设备和计算机可读存储介质。该方法包括:基于基因组的测序序列的SV信号构建断点末端区间图;为断点末端区间图的每条边构建一个断点末端图并且确定一个或多个断点末端列表;对每个断点末端列表推测第一候选SV;对每个断点末端列表的测序序列进行局部组装以获取局部组装序列集合,并且检测第二候选SV集合;响应于确定第一候选SV包含于第二候选SV集合中,将第二候选SV集合确定为候选SV集合;响应于确定第一候选SV不包含于第二候选SV集合中,将第一候选SV和第二候选SV集合的并集确定为候选SV集合;以及基于所有断点末端列表的所有候选SV集合确定基因组SV。

    校正测序数据、检测拷贝数变异的方法、设备和介质

    公开(公告)号:CN114792548A

    公开(公告)日:2022-07-26

    申请号:CN202210663961.5

    申请日:2022-06-14

    Abstract: 本发明涉及一种校正测序数据、检测拷贝数变异的方法、设备和介质。该方法包括:计算每一条唯一比对上的读长在参考基因组中的位置和每个位置被测序到的次数;将基因组按照预定长度的窗口进行划分,以便统计每一个窗口内比对上的读长数目;针对每一个窗口内的比对上的读长数目进行GC校正,生成经由窗口层面的GC校正的每个窗口的唯一比对数;基于染色体层面的唯一比对数占比,获得唯一比对数占比调整比例,以便生成经由染色体层面的GC校正的每个窗口的唯一比对数;以及针对经由染色体层面的GC校正的每个窗口的唯一比对数进行归一化,以便获得经由归一化和GC矫正的每个窗口的唯一比对数。本发明能显著提高针对高GC含量的区域的校正效果。

    处理表格的方法、计算设备和计算机可读存储介质

    公开(公告)号:CN113221523A

    公开(公告)日:2021-08-06

    申请号:CN202110529807.4

    申请日:2021-05-14

    Abstract: 本公开提供了一种处理表格的方法、计算设备和计算机可读存储介质。该方法包括:利用目标检测模型从图片中截取一个或多个表格子图,其中每个表格子图包括一个表格;对每个表格子图进行光学字符识别以检测所述表格子图中的多个字块,其中每个字块包含一个或多个字符;利用深度神经网络模型预测所述多个字块中的任意两个字块处于同一行的行概率和处于同一列的列概率;以及基于所述多个字块中的任意两个字块处于同一行的行概率和处于同一列的列概率对所述多个字块进行结构化重组以将所述表格重建为结构化表格。

Patent Agency Ranking