-
公开(公告)号:CN105893788A
公开(公告)日:2016-08-24
申请号:CN201610265225.9
申请日:2016-04-26
Applicant: 哈尔滨工程大学
IPC: G06F19/20
CPC classification number: G06F19/20
Abstract: 本发明提供的是一种利用参考基因组信息的半导体测序平台的测序数据校正方法。1)利用半导体测序平台测序数据中检测碱基的解读长度与参考基因组中对应碱基的长度一致时的测得电压值,计算碱基长度已知时测得电压值的先验概率分布;2)当半导体测序平台测序数据中检测碱基的解读长度与参考基因组中对应碱基的长度不一致时,对测序数据的碱基长度进行校正,利用下式计算测得电压值已知时,假定碱基长度为l时的值Sl;取Sl最大时对应的碱基长度l,即为测得电压值已知时被测碱基的碱基长度,完成测序数据校正。本发明创新性地提出测得电压值解算碱基长度的过程中,在测得电压值基础上,引入参考基因组信息,以实现对测序数据的校正。
-
公开(公告)号:CN105893788B
公开(公告)日:2018-04-17
申请号:CN201610265225.9
申请日:2016-04-26
Applicant: 哈尔滨工程大学
IPC: G06F19/20
Abstract: 本发明提供的是一种利用参考基因组信息的半导体测序平台的测序数据校正方法。1)利用半导体测序平台测序数据中检测碱基的解读长度与参考基因组中对应碱基的长度一致时的测得电压值,计算碱基长度已知时测得电压值的先验概率分布;2)当半导体测序平台测序数据中检测碱基的解读长度与参考基因组中对应碱基的长度不一致时,对测序数据的碱基长度进行校正,利用下式计算测得电压值已知时,假定碱基长度为l时的值Sl;取Sl最大时对应的碱基长度l,即为测得电压值已知时被测碱基的碱基长度,完成测序数据校正。本发明创新性地提出测得电压值解算碱基长度的过程中,在测得电压值基础上,引入参考基因组信息,以实现对测序数据的校正。
-