面向群体基因组索引表示与构建的方法及设备

    公开(公告)号:CN115662523B

    公开(公告)日:2023-06-20

    申请号:CN202211295056.5

    申请日:2022-10-21

    Abstract: 面向群体基因组索引表示与构建的方法及设备,属于基因技术与计算机技术结合领域。本发明为了解决现有基因组索引结构构建的方法无法对PB级群体基因组数据构建有效的索引结构的问题。本发明对参考基因组构建de Bruijn图模型索引表示,确定每个唯一路径unipath;将参考基因组按照固定长度区间进行有重叠划分,每两个相邻局部区域有部分重叠,针对某个体的单体型,收集每个局部区域内的变异,生成局部变异序列,进而生成变异序列索引文件alt string;分别将unipath以及alt string列表转换为字符串列表并基于minimizer进行群体基因组索引的表示与构建。

    一种基于序列比对骨架的基因组变异检测方法

    公开(公告)号:CN115602244B

    公开(公告)日:2023-04-28

    申请号:CN202211304319.4

    申请日:2022-10-24

    Abstract: 一种基于序列比对骨架的基因组变异检测方法,涉及基因检测技术领域,针对现有技术中变异检测效率低的问题,本申请提出的基于比对骨架和共识序列重构的变异检测方法,通过稀疏动态规划构建测序片段比对骨架,采用Landau‑Vishkin和Smith‑Waterman算法对骨架GAP区域进行填充;据不同候选变异位点的序列和分布特征将其划分为高置信度候选变异位点和低置信度候选变异位点,并分别使用两种不同的策略进行变异检测和基因型推断。1)序列比对阶段,本申请较当前主流比对方法比对效率提升7倍以上;2)变异检测阶段,本申请较当前主流变异检测方法检测效率提升20‑70倍。

    一种基于比对框架的三代测序数据结构变异检测方法

    公开(公告)号:CN115910199A

    公开(公告)日:2023-04-04

    申请号:CN202211366609.1

    申请日:2022-11-01

    Abstract: 一种基于比对框架的三代测序数据结构变异检测方法,涉及基因生物学技术领域。本发明是为了解决现有针对三代测序数据的变异检测方法还存在检测时间长、计算量大的问题。本发明包括:利用测序序列获取精确匹配片段:采用模糊比对方法对精确匹配片段进行延伸,获得模糊匹配片段;采用稀疏动态规划算法利用模糊匹配片段构建比对框架;对比对框架上的模糊匹配片段进行扩展获取最大匹配块,对最大匹配块的一致性关系解析,获得结构变异;对结构变异进行聚类,将同一类型的结构变异进行合并获得每个类型的结构变异簇;根据每个类型的结构变异簇进行结构变异检测,获得变异位点、变异长度、变异序列。本发明用于检测结构变异。

    一种基于深度相机和惯性融合的移动机器人定位方法

    公开(公告)号:CN115371665A

    公开(公告)日:2022-11-22

    申请号:CN202211119147.3

    申请日:2022-09-13

    Abstract: 一种基于深度相机和惯性融合的移动机器人定位方法,它属于视觉惯性导航技术领域。本发明解决了由于受到移动机器人运动方式和环境的影响,导致当前视觉SLAM系统容易出现定位失败或获得的定位效果差的问题。本发明利用了深度相机的深度不确定性模型和多视图三角化结合的方法,能够自适应地完成不同距离特征点的深度估计。并且在此基础上,提出了特征点动态分级管理方法,该方法结合跟踪次数和重投影误差动态地进行特征点分类并去除离群点。通过构建IMU预积分先验误差模型,平面运动约束,特征点深度约束以及3D‑2D特征点重投影误差模型,利用多种约束联合实现移动机器人位姿的估计。本发明方法可以应用于视觉惯性导航技术领域。

    一种基于外显子区域插入的数据压缩方法

    公开(公告)号:CN112863600B

    公开(公告)日:2022-05-24

    申请号:CN202110388432.4

    申请日:2021-04-12

    Abstract: 一种基于外显子区域插入的数据压缩方法,涉及数据压缩领域。本发明是为了解决现有的数据压缩方法压缩时运行速度慢、压缩适应范围窄、压缩存储量消耗大的问题。本发明包括:对测序短读DNA数据进行预处理获取外显子数据集合;对外显子数据集合进行质控获取异常值并将异常值存储在哈希表中;将哈希表中的异常值进行有序存放;使用霍夫曼编码对存放在哈希表中的异常值中的碱基进行压缩存储;利用LYZip局部解压缩方法判断此时累积插入序列深度是否已经达到30X,如果大于30X则表明无法进行插入压缩;如果小于30X,并且累加上新加入的插入序列仍然小于30X,则重复压缩步骤。本发明用于对数据的压缩。

    一种DNA自索引区间解压缩方法

    公开(公告)号:CN113098526A

    公开(公告)日:2021-07-09

    申请号:CN202110377573.6

    申请日:2021-04-08

    Inventor: 李杨 刘博 王亚东

    Abstract: 一种DNA自索引区间解压缩方法,它属于DNA压缩数据的解压缩技术领域。本发明解决了现有的解压缩算法需要的解压缩时间长,且解压缩后的数据需要的存储空间大的问题。本发明的自索引区间解压缩算法可以根据需求来选取解压缩的范围,相对于全局静态TPBWT解压缩算法来说,很大程度的降低了解压缩时间,同时也降低了解压缩数据的存储空间。相对于传统解压缩算法,该算法更加灵活能够依据不同需求,解压缩出不同含义的数据,适用性更强。本发明可以应用于对DNA压缩数据的解压缩。

    一种基于信息熵的基因序列数字化实现方法及系统

    公开(公告)号:CN109903812A

    公开(公告)日:2019-06-18

    申请号:CN201910133090.4

    申请日:2019-02-22

    Abstract: 本发明公开了一种基于信息熵的基因序列数字化实现方法及系统。其中,所述方法包括:输入脱氧核糖核酸DNA序列,设定滑动窗口的长度l及子串长度n,和根据该设定的滑动窗口的长度l,从该输入的脱氧核糖核酸DNA序列的第一个碱基开始,步长为1,和计算该设定的滑动窗口内的给定子串长度下的拓扑熵大小,赋值给该设定的滑动窗口内的碱基,和重复计算该设定的滑动窗口内的给定子串长度下的拓扑熵大小,赋值给该设定的滑动窗口内的碱基,直到到达该输入的脱氧核糖核酸DNA序列的最后一个碱基位置,和输出得到同该输入的脱氧核糖核酸DNA序列长度的数字序列。通过上述方式,能够实现预测基因序列中的外显子区域。

    基于广播Gossip算法的分布式时钟同步方法

    公开(公告)号:CN103152817B

    公开(公告)日:2015-04-15

    申请号:CN201310101164.9

    申请日:2013-03-27

    Abstract: 基于广播Gossip算法的分布式时钟同步方法,涉及一种无线传感器网络的分布式时钟同步技术,解决目前所有的广播Gossip算法都面临着不能保证每个节点的时钟收敛于它们初始时钟的平均值的,致使每个节点最终达成的同步时钟会与它们初始时钟的均值有较大的偏差,不利于进行网络维护和数据分析问题。包括步骤:对包含有N个节点的无线传感器网络初始化;使每个节点获得入度信息和加扰参数值;设定节点的两个变量;判断各节点的状态:将定时期满的触发节点的变量值广播给它的外邻节点;对网络中的节点的变量值进行更新;判断无线传感器网络中N个节点的两个变量是否都收敛于同一个同步时钟值;获得时钟同步结果,完成迭代过程。本发明可广泛应用于分布式时钟同步。

Patent Agency Ranking