-
公开(公告)号:CN108154007B
公开(公告)日:2021-06-29
申请号:CN201711219637.X
申请日:2017-11-28
Applicant: 西安电子科技大学
Abstract: 本发明属于拷贝数变异检测技术领域,公开了一种基于单肿瘤样本拷贝数变异及缺失类型检测方法、计算机,建立拷贝数扩展和拷贝数缺失幅度的动态平衡机制,迭代检测过程不断更正读段数的基准,更正统计检验分布的参数,客观检测显著性拷贝数变异以及弱显著的拷贝数变异;构建贝叶斯推理模型,正确检测拷贝数变异状态及拷贝数缺失类型。本发明正确检测拷贝数变异状态及拷贝数缺失类型,提供杂合子缺失与同源缺失的信息。本发明考虑比对质量及错误问题,合理地更正了全基因组GC含量;建立拷贝数扩展和拷贝数缺失幅度的动态平衡机制,以准确定位拷贝数的基准,准确检测拷贝数的变异状态。
-
公开(公告)号:CN108154007A
公开(公告)日:2018-06-12
申请号:CN201711219637.X
申请日:2017-11-28
Applicant: 西安电子科技大学
IPC: G06F19/18
Abstract: 本发明属于拷贝数变异检测技术领域,公开了一种基于单肿瘤样本拷贝数变异及缺失类型检测方法、计算机,建立拷贝数扩展和拷贝数缺失幅度的动态平衡机制,迭代检测过程不断更正读段数的基准,更正统计检验分布的参数,客观检测显著性拷贝数变异以及弱显著的拷贝数变异;构建贝叶斯推理模型,正确检测拷贝数变异状态及拷贝数缺失类型。本发明正确检测拷贝数变异状态及拷贝数缺失类型,提供杂合子缺失与同源缺失的信息。本发明考虑比对质量及错误问题,合理地更正了全基因组GC含量;建立拷贝数扩展和拷贝数缺失幅度的动态平衡机制,以准确定位拷贝数的基准,准确检测拷贝数的变异状态。
-
公开(公告)号:CN107229839A
公开(公告)日:2017-10-03
申请号:CN201710377194.0
申请日:2017-05-25
Applicant: 西安电子科技大学
Abstract: 本发明属于基因工程技术领域,公开了一种基于新一代测序数据的Indel检测方法,包括:利用bwa比对软件对原始的fastq数据做比对,生成sam文件;对二维点根据设定的阈值进行层次聚类;对hang.sam文件中的每一对reads,取出未正常比对的read;将read和截取下来的参考序列做比对即可确定变异类型,变异位置,以及变异大小;利用哈希结构来存储变异;对于某个变异,根据测序的覆盖度设置阈值。本发明通过聚类确定一个变异的范围,提取Split read与变异范围内的参考序列进行比对,使得比对的过程变得简单、范围更加精确;使用层次聚类,突破提前设置聚类个数的限制,操作简单。
-
公开(公告)号:CN106682450B
公开(公告)日:2019-05-07
申请号:CN201611040978.6
申请日:2016-11-24
Applicant: 西安电子科技大学
IPC: G16B5/00
Abstract: 本发明公开了一种基于状态转移模型的新一代测序拷贝数变异仿真方法,采用拷贝数变异仿真算法;在仿真算法中增加状态转移模型,在变异仿真之后增加序列生成部分;拷贝数变异包括生殖细胞拷贝数变异和体细胞拷贝数变异;基于Illumina测序平台的Profile文件的生成;将fq文件的reads说明部分的ASCii码转换成碱基的quality value,相应方法是对应字符的ASCii码减去33;将变异仿真后的fa文件和生成的profile文件作为输入,设置read length,利用多线程和序列生成算法,生成并输出最终的fq文件。本发明使得生物变异的仿真更加具有可信度,功能完整,数据真实。
-
公开(公告)号:CN107229839B
公开(公告)日:2020-05-22
申请号:CN201710377194.0
申请日:2017-05-25
Applicant: 西安电子科技大学
Abstract: 本发明属于基因工程技术领域,公开了一种基于新一代测序数据的Indel检测方法,包括:利用bwa比对软件对原始的fastq数据做比对,生成sam文件;对二维点根据设定的阈值进行层次聚类;对hang.sam文件中的每一对reads,取出未正常比对的read;将read和截取下来的参考序列做比对即可确定变异类型,变异位置,以及变异大小;利用哈希结构来存储变异;对于某个变异,根据测序的覆盖度设置阈值。本发明通过聚类确定一个变异的范围,提取Split read与变异范围内的参考序列进行比对,使得比对的过程变得简单、范围更加精确;使用层次聚类,突破提前设置聚类个数的限制,操作简单。
-
公开(公告)号:CN105760712B
公开(公告)日:2019-03-26
申请号:CN201610114354.8
申请日:2016-03-01
Applicant: 西安电子科技大学
Abstract: 本发明公开了一种基于新一代测序的拷贝数变异检测方法,该方法包括拷贝数变异数据的预处理、滑动窗口的构造、统计量的计算、置换策略的实施与零分布的构造、算法的性能评估,算法的性能评估采用判断算法能否在错误肯定率可控的情况下,获得较高的正确肯定率,评价算法是否能够较准确地估计p值,拷贝数变异的边界检出能力;分析算法的计算复杂度。本发明解决了由于测序平台及测序水平不同引起的拷贝数变异检测误差问题,令结果更准确;利用从多峰频率直方图特点归一化数据,以准确划分正常区域和拷贝数变异区域;本发明变异reads数与变异位点间关联性的综合作用,建立新模型,解决不一致性问题,客观估计拷贝数变异的显著性水平。
-
公开(公告)号:CN105760712A
公开(公告)日:2016-07-13
申请号:CN201610114354.8
申请日:2016-03-01
Applicant: 西安电子科技大学
Abstract: 本发明公开了一种基于新一代测序的拷贝数变异检测方法,该方法包括拷贝数变异数据的预处理、滑动窗口的构造、统计量的计算、置换策略的实施与零分布的构造、算法的性能评估,算法的性能评估采用判断算法能否在错误肯定率可控的情况下,获得较高的正确肯定率,评价算法是否能够较准确地估计p值,拷贝数变异的边界检出能力;分析算法的计算复杂度。本发明解决了由于测序平台及测序水平不同引起的拷贝数变异检测误差问题,令结果更准确;利用从多峰频率直方图特点归一化数据,以准确划分正常区域和拷贝数变异区域;本发明变异reads数与变异位点间关联性的综合作用,建立新模型,解决不一致性问题,客观估计拷贝数变异的显著性水平。
-
公开(公告)号:CN106682450A
公开(公告)日:2017-05-17
申请号:CN201611040978.6
申请日:2016-11-24
Applicant: 西安电子科技大学
IPC: G06F19/12
CPC classification number: G06F19/12
Abstract: 本发明公开了一种基于状态转移模型的新一代测序拷贝数变异仿真方法,采用拷贝数变异仿真算法;在仿真算法中增加状态转移模型,在变异仿真之后增加序列生成部分;拷贝数变异包括生殖细胞拷贝数变异和体细胞拷贝数变异;基于Illumina测序平台的Profile文件的生成;将fq文件的reads说明部分的ASCii码转换成碱基的quality value,相应方法是对应字符的ASCii码减去33;将变异仿真后的fa文件和生成的profile文件作为输入,设置read length,利用多线程和序列生成算法,生成并输出最终的fq文件。本发明使得生物变异的仿真更加具有可信度,功能完整,数据真实。
-
-
-
-
-
-
-