-
公开(公告)号:CN115631789B
公开(公告)日:2023-08-15
申请号:CN202211313819.4
申请日:2022-10-25
Applicant: 哈尔滨工业大学
Abstract: 一种基于泛基因组的群体联合变异检测方法,涉及基因生物学技术领域。本发明是为了解决目前群体联合变异检测方法还存在比对效率低、变异检测灵敏度弱、检测结果不够准确的问题。本发明包括:获取参考基因组和被测样本基因组,并利用参考基因组和被测样本基因组识别被测样本基因组上的候选变异位点,并对候选变异点位进行分类;根据候选变异点位的类型利用候选变异位点构建局部单体型序列,并对构建好的局部单体型序列在样本间整合,获得整合后的单体型序列集合;利用整合后的单体型序列检测被测样本基因组的变异位点的基因型;遍历群体内所有被测样本基因组,并重复执行步骤一到三,获得群体内所有变异基因型。本发明用于群体基因组联合变异检测。
-
公开(公告)号:CN115602246B
公开(公告)日:2023-06-20
申请号:CN202211366121.9
申请日:2022-10-31
Applicant: 哈尔滨工业大学
Abstract: 一种基于群体基因组的序列比对方法,具体涉及一种基于群体基因组的人体DNA序列比对方法,为了解决以单一参考基因组作为基准的序列比对方法存在精度偏差,导致测序数据变异检测失败或得到错误变异位点的问题,首先构建基于种子序列的群体基因组索引,提取测序序列的种子序列,利用索引获取种子序列在基因组的位置;其次,根据位置利用稀疏动态规划方法得到种子序列在基因组上最优和次优路径集合;最终,根据最优和次优路径集合得到测序序列在基因组上对应的序列,采用KSW2算法比对测序序列与对应的序列,得到比对得分,根据比对得分得到结果比对文件。属于序列比对领域。
-
公开(公告)号:CN115662521B
公开(公告)日:2023-06-13
申请号:CN202211386630.8
申请日:2022-11-07
Applicant: 哈尔滨工业大学
Abstract: 基于泛基因组的序列实时比对方法,具体涉及一种面向边合成边测序类测序技术的基于泛基因组的序列实时精确比对方法,为解决由于DNA序列比对是在序列测序之后,导致边合成边测序类测序技术在序列比对时会耗费大量的计算资源以及计算时间的问题,构建泛基因组;将泛基因组转换为线性序列与线性参考基因组合并;将合并序列的正反序列合并,并构建其BWT索引;删除BWT索引的SA列表上无效或者重复的信息;根据新BWT索引对待测序序列进行比对,得到比对结果并存储;获取待测序序列在泛基因组上的比对位置;选取待测序序列最优的比对位置作为最终比对结果;利用基数排序算法对最终比对结果进行排序,完成待测序序列的比对。
-
公开(公告)号:CN115662523A
公开(公告)日:2023-01-31
申请号:CN202211295056.5
申请日:2022-10-21
Applicant: 哈尔滨工业大学
Abstract: 面向群体基因组索引表示与构建的方法及设备,属于基因技术与计算机技术结合领域。本发明为了解决现有基因组索引结构构建的方法无法对PB级群体基因组数据构建有效的索引结构的问题。本发明对参考基因组构建de Bruijn图模型索引表示,确定每个唯一路径unipath;将参考基因组按照固定长度区间进行有重叠划分,每两个相邻局部区域有部分重叠,针对某个体的单体型,收集每个局部区域内的变异,生成局部变异序列,进而生成变异序列索引文件alt string;分别将unipath以及alt string列表转换为字符串列表并基于minimizer进行群体基因组索引的表示与构建。
-
公开(公告)号:CN115631789A
公开(公告)日:2023-01-20
申请号:CN202211313819.4
申请日:2022-10-25
Applicant: 哈尔滨工业大学
Abstract: 一种基于泛基因组的群体联合变异检测方法,涉及基因生物学技术领域。本发明是为了解决目前群体联合变异检测方法还存在比对效率低、变异检测灵敏度弱、检测结果不够准确的问题。本发明包括:获取参考基因组和被测样本基因组,并利用参考基因组和被测样本基因组识别被测样本基因组上的候选变异位点,并对候选变异点位进行分类;根据候选变异点位的类型利用候选变异位点构建局部单体型序列,并对构建好的局部单体型序列在样本间整合,获得整合后的单体型序列集合;利用整合后的单体型序列检测被测样本基因组的变异位点的基因型;遍历群体内所有被测样本基因组,并重复执行步骤一到三,获得群体内所有变异基因型。本发明用于群体基因组联合变异检测。
-
公开(公告)号:CN115662523B
公开(公告)日:2023-06-20
申请号:CN202211295056.5
申请日:2022-10-21
Applicant: 哈尔滨工业大学
Abstract: 面向群体基因组索引表示与构建的方法及设备,属于基因技术与计算机技术结合领域。本发明为了解决现有基因组索引结构构建的方法无法对PB级群体基因组数据构建有效的索引结构的问题。本发明对参考基因组构建de Bruijn图模型索引表示,确定每个唯一路径unipath;将参考基因组按照固定长度区间进行有重叠划分,每两个相邻局部区域有部分重叠,针对某个体的单体型,收集每个局部区域内的变异,生成局部变异序列,进而生成变异序列索引文件alt string;分别将unipath以及alt string列表转换为字符串列表并基于minimizer进行群体基因组索引的表示与构建。
-
公开(公告)号:CN115662521A
公开(公告)日:2023-01-31
申请号:CN202211386630.8
申请日:2022-11-07
Applicant: 哈尔滨工业大学
Abstract: 基于泛基因组的序列实时比对方法,具体涉及一种面向边合成边测序类测序技术的基于泛基因组的序列实时精确比对方法,为解决由于DNA序列比对是在序列测序之后,导致边合成边测序类测序技术在序列比对时会耗费大量的计算资源以及计算时间的问题,构建泛基因组;将泛基因组转换为线性序列与线性参考基因组合并;将合并序列的正反序列合并,并构建其BWT索引;删除BWT索引的SA列表上无效或者重复的信息;根据新BWT索引对待测序序列进行比对,得到比对结果并存储;获取待测序序列在泛基因组上的比对位置;选取待测序序列最优的比对位置作为最终比对结果;利用基数排序算法对最终比对结果进行排序,完成待测序序列的比对。
-
公开(公告)号:CN115602246A
公开(公告)日:2023-01-13
申请号:CN202211366121.9
申请日:2022-10-31
Applicant: 哈尔滨工业大学(CN)
Abstract: 一种基于群体基因组的序列比对方法,具体涉及一种基于群体基因组的人体DNA序列比对方法,为了解决以单一参考基因组作为基准的序列比对方法存在精度偏差,导致测序数据变异检测失败或得到错误变异位点的问题,首先构建基于种子序列的群体基因组索引,提取测序序列的种子序列,利用索引获取种子序列在基因组的位置;其次,根据位置利用稀疏动态规划方法得到种子序列在基因组上最优和次优路径集合;最终,根据最优和次优路径集合得到测序序列在基因组上对应的序列,采用KSW2算法比对测序序列与对应的序列,得到比对得分,根据比对得分得到结果比对文件。属于序列比对领域。
-
-
-
-
-
-
-