-
公开(公告)号:CN108959851B
公开(公告)日:2022-03-18
申请号:CN201810601099.9
申请日:2018-06-12
Applicant: 哈尔滨工程大学
IPC: G16B30/10
Abstract: 本发明提供一种Illumina高通量测序数据误差校正方法,包括:1、对Illumina测序样本同时进行半导体测序。即在得到样本Illumina测序结果的同时,也获取其半导体测序结果;2、分别将Illumina测序结果和半导体测序结果通过序列比对确定每一测序读数在参考基因组中的位置;3、对同一位置的测序结果进行分析。本发明针对该问题提出了一种Illumina高通量测序数据误差校正方法。该方法利用半导体高通量测序结果中碱基类型不易测错的特点,通过逻辑分析Illumina高通量测序结果、半导体高通量测序结果与参考基因组碱基序列之间的对应关系,实现Illumina高通量测序数据的误差校正。
-
公开(公告)号:CN108959851A
公开(公告)日:2018-12-07
申请号:CN201810601099.9
申请日:2018-06-12
Applicant: 哈尔滨工程大学
IPC: G06F19/20
Abstract: 本发明提供一种Illumina高通量测序数据误差校正方法,包括:1、对Illumina测序样本同时进行半导体测序。即在得到样本Illumina测序结果的同时,也获取其半导体测序结果;2、分别将Illumina测序结果和半导体测序结果通过序列比对确定每一测序读数在参考基因组中的位置;3、对同一位置的测序结果进行分析。本发明针对该问题提出了一种Illumina高通量测序数据误差校正方法。该方法利用半导体高通量测序结果中碱基类型不易测错的特点,通过逻辑分析Illumina高通量测序结果、半导体高通量测序结果与参考基因组碱基序列之间的对应关系,实现Illumina高通量测序数据的误差校正。
-
公开(公告)号:CN105893788B
公开(公告)日:2018-04-17
申请号:CN201610265225.9
申请日:2016-04-26
Applicant: 哈尔滨工程大学
IPC: G06F19/20
Abstract: 本发明提供的是一种利用参考基因组信息的半导体测序平台的测序数据校正方法。1)利用半导体测序平台测序数据中检测碱基的解读长度与参考基因组中对应碱基的长度一致时的测得电压值,计算碱基长度已知时测得电压值的先验概率分布;2)当半导体测序平台测序数据中检测碱基的解读长度与参考基因组中对应碱基的长度不一致时,对测序数据的碱基长度进行校正,利用下式计算测得电压值已知时,假定碱基长度为l时的值Sl;取Sl最大时对应的碱基长度l,即为测得电压值已知时被测碱基的碱基长度,完成测序数据校正。本发明创新性地提出测得电压值解算碱基长度的过程中,在测得电压值基础上,引入参考基因组信息,以实现对测序数据的校正。
-
公开(公告)号:CN105205350B
公开(公告)日:2018-04-17
申请号:CN201510537025.X
申请日:2015-08-28
Applicant: 哈尔滨工程大学
IPC: G06F19/22
Abstract: 本发明属于分子生物信息检测与分析领域,具体涉及一种Ion Torrent测序数据中多聚碱基的长度判定方法。本发明包括:(1)Ion Torrent实验数据的获取与多聚碱基信息提取;(2)基因组基本信息的获取及多聚碱基基本信息的提取;(3)多聚碱基长度已知的电压值贝叶斯先验概率计算;(4)判定基因组基本信息和电压值贝叶斯先验概率的多聚碱基长度并对权值参数优化;(5)多聚碱基长度判定。本发明通过所发明的方法可以高精度地依据Ion Torrent测序得到的检测电压值对该电压值对应的多聚碱基的长度进行判定,以生成更加准确的Ion Torrent测序结果,从而为后续更高层次的应用分析提供数据保障。
-
公开(公告)号:CN105893788A
公开(公告)日:2016-08-24
申请号:CN201610265225.9
申请日:2016-04-26
Applicant: 哈尔滨工程大学
IPC: G06F19/20
CPC classification number: G06F19/20
Abstract: 本发明提供的是一种利用参考基因组信息的半导体测序平台的测序数据校正方法。1)利用半导体测序平台测序数据中检测碱基的解读长度与参考基因组中对应碱基的长度一致时的测得电压值,计算碱基长度已知时测得电压值的先验概率分布;2)当半导体测序平台测序数据中检测碱基的解读长度与参考基因组中对应碱基的长度不一致时,对测序数据的碱基长度进行校正,利用下式计算测得电压值已知时,假定碱基长度为l时的值Sl;取Sl最大时对应的碱基长度l,即为测得电压值已知时被测碱基的碱基长度,完成测序数据校正。本发明创新性地提出测得电压值解算碱基长度的过程中,在测得电压值基础上,引入参考基因组信息,以实现对测序数据的校正。
-
公开(公告)号:CN106650313B
公开(公告)日:2019-10-18
申请号:CN201610865814.0
申请日:2016-09-29
Applicant: 哈尔滨工程大学
Abstract: 本发明属于分子生物信息检测与分析领域,具体涉及一种有效提高DNase高通量测序数据的检测信息准确性的滤除DNase高通量测序数据中DNA碱基倾向性偏差的方法。本发明包括:(1)DNase‑Seq实验数据酶切位点区域DNA碱基获取;(2)DNase‑Seq实验数据DNA碱基倾向性获取;(3)DNA碱基倾向性去除。通过所发明的方法可以精确地滤除DNase高通量测序数据中含有的DNA碱基倾向性偏差,以生成更加准确的DNase‑Seq测序结果,从而为后续更高层次的应用分析提供数据保障。
-
公开(公告)号:CN106650313A
公开(公告)日:2017-05-10
申请号:CN201610865814.0
申请日:2016-09-29
Applicant: 哈尔滨工程大学
Abstract: 本发明属于分子生物信息检测与分析领域,具体涉及一种有效提高DNase高通量测序数据的检测信息准确性的滤除DNase高通量测序数据中DNA碱基倾向性偏差的方法。本发明包括:(1)DNase‑Seq实验数据酶切位点区域DNA碱基获取;(2)DNase‑Seq实验数据DNA碱基倾向性获取;(3)DNA碱基倾向性去除。通过所发明的方法可以精确地滤除DNase高通量测序数据中含有的DNA碱基倾向性偏差,以生成更加准确的DNase‑Seq测序结果,从而为后续更高层次的应用分析提供数据保障。
-
公开(公告)号:CN105205350A
公开(公告)日:2015-12-30
申请号:CN201510537025.X
申请日:2015-08-28
Applicant: 哈尔滨工程大学
IPC: G06F19/22
Abstract: 本发明属于分子生物信息检测与分析领域,具体涉及一种Ion Torrent测序数据中多聚碱基的长度判定方法。本发明包括:(1)Ion Torrent实验数据的获取与多聚碱基信息提取;(2)基因组基本信息的获取及多聚碱基基本信息的提取;(3)多聚碱基长度已知的电压值贝叶斯先验概率计算;(4)判定基因组基本信息和电压值贝叶斯先验概率的多聚碱基长度并对权值参数优化;(5)多聚碱基长度判定。本发明通过所发明的方法可以高精度地依据Ion Torrent测序得到的检测电压值对该电压值对应的多聚碱基的长度进行判定,以生成更加准确的Ion Torrent测序结果,从而为后续更高层次的应用分析提供数据保障。
-
-
-
-
-
-
-