-
公开(公告)号:CN104951672B
公开(公告)日:2017-08-29
申请号:CN201510346970.1
申请日:2015-06-19
Applicant: 中国科学院计算技术研究所
IPC: G06F19/22
Abstract: 本发明涉及生物信息技术和计算生物学领域,特别涉及一种第二代、三代基因组测序数据联用的拼接方法及系统,该方法包括获取第二代基因组测序数据,通过所述第二代基因组测序数据中部分碱基序列reads的质量信息,对所述第二代基因组测序数据进行预处理,构建de Brui jn图;对所述de Brui jn图进行测序错误处理,生成新的de Brui jn图,对所述新的de Brui jn图进行压缩,生成压缩de Brui jn图,获取所述压缩de Brui jn图中压缩边的序列重数;获取第三代基因组测序数据,将所述第三代基因组测序数据回帖到所述第二代基因组测序数据的单分子图gapped fragments上,通过最优排布拆解压缩de Brui jn图,并填充最优排布之间的空隙,以完成基因组测序数据的拼接。
-
公开(公告)号:CN104951672A
公开(公告)日:2015-09-30
申请号:CN201510346970.1
申请日:2015-06-19
Applicant: 中国科学院计算技术研究所
IPC: G06F19/22
Abstract: 本发明涉及生物信息技术和计算生物学领域,特别涉及一种第二代、三代基因组测序数据联用的拼接方法及系统,该方法包括获取第二代基因组测序数据,通过所述第二代基因组测序数据中部分碱基序列reads的质量信息,对所述第二代基因组测序数据进行预处理,构建de Brui jn图;对所述de Brui jn图进行测序错误处理,生成新的de Brui jn图,对所述新的de Brui jn图进行压缩,生成压缩de Brui jn图,获取所述压缩de Brui jn图中压缩边的序列重数;获取第三代基因组测序数据,将所述第三代基因组测序数据回帖到所述第二代基因组测序数据的单分子图gapped fragments上,通过最优排布拆解压缩de Brui jn图,并填充最优排布之间的空隙,以完成基因组测序数据的拼接。
-