面向群体基因组索引表示与构建的方法及设备

    公开(公告)号:CN115662523B

    公开(公告)日:2023-06-20

    申请号:CN202211295056.5

    申请日:2022-10-21

    Abstract: 面向群体基因组索引表示与构建的方法及设备,属于基因技术与计算机技术结合领域。本发明为了解决现有基因组索引结构构建的方法无法对PB级群体基因组数据构建有效的索引结构的问题。本发明对参考基因组构建de Bruijn图模型索引表示,确定每个唯一路径unipath;将参考基因组按照固定长度区间进行有重叠划分,每两个相邻局部区域有部分重叠,针对某个体的单体型,收集每个局部区域内的变异,生成局部变异序列,进而生成变异序列索引文件alt string;分别将unipath以及alt string列表转换为字符串列表并基于minimizer进行群体基因组索引的表示与构建。

    一种基于群体基因组的序列比对方法

    公开(公告)号:CN115602246B

    公开(公告)日:2023-06-20

    申请号:CN202211366121.9

    申请日:2022-10-31

    Abstract: 一种基于群体基因组的序列比对方法,具体涉及一种基于群体基因组的人体DNA序列比对方法,为了解决以单一参考基因组作为基准的序列比对方法存在精度偏差,导致测序数据变异检测失败或得到错误变异位点的问题,首先构建基于种子序列的群体基因组索引,提取测序序列的种子序列,利用索引获取种子序列在基因组的位置;其次,根据位置利用稀疏动态规划方法得到种子序列在基因组上最优和次优路径集合;最终,根据最优和次优路径集合得到测序序列在基因组上对应的序列,采用KSW2算法比对测序序列与对应的序列,得到比对得分,根据比对得分得到结果比对文件。属于序列比对领域。

    基于泛基因组的序列实时比对方法

    公开(公告)号:CN115662521B

    公开(公告)日:2023-06-13

    申请号:CN202211386630.8

    申请日:2022-11-07

    Abstract: 基于泛基因组的序列实时比对方法,具体涉及一种面向边合成边测序类测序技术的基于泛基因组的序列实时精确比对方法,为解决由于DNA序列比对是在序列测序之后,导致边合成边测序类测序技术在序列比对时会耗费大量的计算资源以及计算时间的问题,构建泛基因组;将泛基因组转换为线性序列与线性参考基因组合并;将合并序列的正反序列合并,并构建其BWT索引;删除BWT索引的SA列表上无效或者重复的信息;根据新BWT索引对待测序序列进行比对,得到比对结果并存储;获取待测序序列在泛基因组上的比对位置;选取待测序序列最优的比对位置作为最终比对结果;利用基数排序算法对最终比对结果进行排序,完成待测序序列的比对。

    基于泛基因组的序列实时比对方法

    公开(公告)号:CN115662521A

    公开(公告)日:2023-01-31

    申请号:CN202211386630.8

    申请日:2022-11-07

    Abstract: 基于泛基因组的序列实时比对方法,具体涉及一种面向边合成边测序类测序技术的基于泛基因组的序列实时精确比对方法,为解决由于DNA序列比对是在序列测序之后,导致边合成边测序类测序技术在序列比对时会耗费大量的计算资源以及计算时间的问题,构建泛基因组;将泛基因组转换为线性序列与线性参考基因组合并;将合并序列的正反序列合并,并构建其BWT索引;删除BWT索引的SA列表上无效或者重复的信息;根据新BWT索引对待测序序列进行比对,得到比对结果并存储;获取待测序序列在泛基因组上的比对位置;选取待测序序列最优的比对位置作为最终比对结果;利用基数排序算法对最终比对结果进行排序,完成待测序序列的比对。

    一种基于群体基因组的序列比对方法

    公开(公告)号:CN115602246A

    公开(公告)日:2023-01-13

    申请号:CN202211366121.9

    申请日:2022-10-31

    Abstract: 一种基于群体基因组的序列比对方法,具体涉及一种基于群体基因组的人体DNA序列比对方法,为了解决以单一参考基因组作为基准的序列比对方法存在精度偏差,导致测序数据变异检测失败或得到错误变异位点的问题,首先构建基于种子序列的群体基因组索引,提取测序序列的种子序列,利用索引获取种子序列在基因组的位置;其次,根据位置利用稀疏动态规划方法得到种子序列在基因组上最优和次优路径集合;最终,根据最优和次优路径集合得到测序序列在基因组上对应的序列,采用KSW2算法比对测序序列与对应的序列,得到比对得分,根据比对得分得到结果比对文件。属于序列比对领域。

    一种网络生物数据物种分类识别系统

    公开(公告)号:CN118430651A

    公开(公告)日:2024-08-02

    申请号:CN202410503680.2

    申请日:2024-04-24

    Abstract: 本发明提出了一种网络生物数据物种分类识别系统,包括文件类型识别模块、索引构建模块、序列比对与分类模块、物种分类识别比对结果分析模块。索引构建模块允许用户根据需要调节系统的审查严格程度与速度,通过选择增加或减少参考物种的数量来构建索引。序列比对和分类模块通过采用多线程架构和高效的优化的比对算法,生成标准的SAM格式结果。数据统计和分析模块进一步分析这些结果,使用最近公共祖先(LCA)算法确保提供准确的物种识别信息。该系统利用深度学习技术与基于规则的方法识别传入的生物数据文件类型,确保只处理目标生物数据,优化了生物数据的处理流程,提高了数据处理的效率和精确性,特别适合需要高度数据安全和快速响应的应用场景。

    面向群体基因组索引表示与构建的方法及设备

    公开(公告)号:CN115662523A

    公开(公告)日:2023-01-31

    申请号:CN202211295056.5

    申请日:2022-10-21

    Abstract: 面向群体基因组索引表示与构建的方法及设备,属于基因技术与计算机技术结合领域。本发明为了解决现有基因组索引结构构建的方法无法对PB级群体基因组数据构建有效的索引结构的问题。本发明对参考基因组构建de Bruijn图模型索引表示,确定每个唯一路径unipath;将参考基因组按照固定长度区间进行有重叠划分,每两个相邻局部区域有部分重叠,针对某个体的单体型,收集每个局部区域内的变异,生成局部变异序列,进而生成变异序列索引文件alt string;分别将unipath以及alt string列表转换为字符串列表并基于minimizer进行群体基因组索引的表示与构建。

Patent Agency Ranking