一种DNA活字印刷机、基于DNA的数据存储设备和方法

    公开(公告)号:CN111680797B

    公开(公告)日:2023-06-06

    申请号:CN202010381206.9

    申请日:2020-05-08

    Abstract: 本发明实施例提供了一种DNA活字印刷机、基于DNA的数据存储设备和方法,所述DNA活字印刷机包括:PCR反应区,用于通过PCR反应将获取的多种DNA活字序列按序连接为表示二进制信息的DNA序列,其中,每种DNA活字序列是根据预定的映射规则预先合成的单链DNA片段,所述预定的映射规则用于定义特定的多位二进制码与特定的碱基序列之间的映射关系,每个单链DNA片段中包含与某个特定的多位二进制码对应的碱基序列;PCR产物纯化区,用于对经过PCR反应的产物进行纯化;机械臂;以及机械臂控制模块,用于控制所述机械臂以获取所述DNA活字序列,以及控制所述机械臂作为PCR反应区的产物和PCR产物纯化区的产物的转移工具,本发明能够提供高效和高性价比的DNA存储。

    直接利用蛋白质多序列联配信息构建蛋白质结构的方法

    公开(公告)号:CN112185466A

    公开(公告)日:2021-01-05

    申请号:CN202011016871.4

    申请日:2020-09-24

    Abstract: 本发明提出一种直接利用蛋白质多序列联配信息构建蛋白质结构的方法和系统,包括:使用第一编码器为蛋白质多序列联配信息中每个残基位置提取上下文表示作为该残基位置所处的结构环境;使用聚合器根据该结构环境聚合每个残基对编码特征向量,将得到该蛋白质多序列联配信息中残基对的聚合特征作为初始关联性;根据所有残基对的全局上下文,使用第二编码器细化该初始关联性,得到该蛋白质多序列联配信息中每一个残基对的最终关联性,根据该最终关联性生成该蛋白质多序列联配信息中残基间距离,基于该残基间距离构建蛋白质的三级结构。本发明直接从多序列联配学习残基间距离,因此可以提高残基间距离预测的精度,显著提高了蛋白质空间结构的预测精度。

    多级质谱生物大分子结构鉴定方法

    公开(公告)号:CN104965020A

    公开(公告)日:2015-10-07

    申请号:CN201510290301.7

    申请日:2015-05-29

    Abstract: 本发明提供一种多级质谱生物大分子结构鉴定方法,包括:1)获得样品的二级质谱作为当前质谱;2)在当前质谱中,选择产生下一级质谱的离子,基于所选择的离子进行质谱实验获得所述下一级质谱;3)使用层次贝叶斯模型将所述当前质谱的后验概率以先验概率的方式代入所述下一级质谱,进而对每个候选结构对应的理论质谱进行谱谱比对打分;4)如果无法根据当前的谱谱比对打分结果得出唯一的匹配结构,则将所述下一级质谱作为当前质谱,重复步骤2)进行下一级的质谱分析,直至得出唯一的匹配结构。本发明能够提升生物大分子结构尤其是糖结构同分异构体的鉴定准确度;能够显著降低多级质谱鉴定的开销,例如花费较少的样品量及鉴定时间。

    一种第二代、三代基因组测序数据联用的拼接方法及系统

    公开(公告)号:CN104951672A

    公开(公告)日:2015-09-30

    申请号:CN201510346970.1

    申请日:2015-06-19

    Abstract: 本发明涉及生物信息技术和计算生物学领域,特别涉及一种第二代、三代基因组测序数据联用的拼接方法及系统,该方法包括获取第二代基因组测序数据,通过所述第二代基因组测序数据中部分碱基序列reads的质量信息,对所述第二代基因组测序数据进行预处理,构建de Brui jn图;对所述de Brui jn图进行测序错误处理,生成新的de Brui jn图,对所述新的de Brui jn图进行压缩,生成压缩de Brui jn图,获取所述压缩de Brui jn图中压缩边的序列重数;获取第三代基因组测序数据,将所述第三代基因组测序数据回帖到所述第二代基因组测序数据的单分子图gapped fragments上,通过最优排布拆解压缩de Brui jn图,并填充最优排布之间的空隙,以完成基因组测序数据的拼接。

    多级质谱生物大分子结构鉴定方法

    公开(公告)号:CN104965020B

    公开(公告)日:2017-07-21

    申请号:CN201510290301.7

    申请日:2015-05-29

    Abstract: 本发明提供一种多级质谱生物大分子结构鉴定方法,包括:1)获得样品的二级质谱作为当前质谱;2)在当前质谱中,选择产生下一级质谱的离子,基于所选择的离子进行质谱实验获得所述下一级质谱;3)使用层次贝叶斯模型将所述当前质谱的后验概率以先验概率的方式代入所述下一级质谱,进而对每个候选结构对应的理论质谱进行谱谱比对打分;4)如果无法根据当前的谱谱比对打分结果得出唯一的匹配结构,则将所述下一级质谱作为当前质谱,重复步骤2)进行下一级的质谱分析,直至得出唯一的匹配结构。本发明能够提升生物大分子结构尤其是糖结构同分异构体的鉴定准确度;能够显著降低多级质谱鉴定的开销,例如花费较少的样品量及鉴定时间。

    快速内容分析的多关键词匹配方法

    公开(公告)号:CN1508721A

    公开(公告)日:2004-06-30

    申请号:CN02157881.8

    申请日:2002-12-20

    Abstract: 本发明一种快速内容分析的多关键词匹配方法,包括如下步骤:1)对关键词进行预处理;2)根据字符在关键词中出现的概率,建立每个字符的哈夫曼编码,然后把每个关键词编码为一个整数;3)使用全部关键词建立一张检测表;4)对文本进行扫描;5)使用该检测表,快速的进行文本内容分析。它能根据关键词中的每个字的出现频率,进行动态调整,从而提高多关键词匹配的速度。与传统的文件内容分析相比,本发明的特点是:针对大量短关键词集合设计了新的基于哈夫曼编码的多关键词匹配算法(Huff-Match)。使用这种新算法,提高了内容分析系统的性能。本发明适用于高性能网络信息过滤、入侵检测、信息监控、病毒检测等领域。

    基于多级质谱技术鉴定糖链混合物的方法

    公开(公告)号:CN117347466A

    公开(公告)日:2024-01-05

    申请号:CN202311261883.7

    申请日:2023-09-27

    Abstract: 本公开提供了一种基于多级质谱技术鉴定糖链混合物的方法,该方法包括以下步骤:根据糖链混合物的一级实验谱,确定与一级实验谱中母离子峰对应的多个候选糖链分支结构;根据多个候选糖链分支结构,通过排列组合方法生成多种候选糖链组合;对每一种候选糖链组合内所有候选糖链分支结构的二级以上理论谱进行加和,得到每一种候选糖链组合的二级以上理论谱;根据每一种候选糖链组合的二级以上理论谱和糖链混合物的二级以上实验谱的相似度,确定糖链混合物中最可能存在的目标糖链组合。

    直接利用蛋白质多序列联配信息构建蛋白质结构的方法

    公开(公告)号:CN112185466B

    公开(公告)日:2023-05-23

    申请号:CN202011016871.4

    申请日:2020-09-24

    Abstract: 本发明提出一种直接利用蛋白质多序列联配信息构建蛋白质结构的方法和系统,包括:使用第一编码器为蛋白质多序列联配信息中每个残基位置提取上下文表示作为该残基位置所处的结构环境;使用聚合器根据该结构环境聚合每个残基对编码特征向量,将得到该蛋白质多序列联配信息中残基对的聚合特征作为初始关联性;根据所有残基对的全局上下文,使用第二编码器细化该初始关联性,得到该蛋白质多序列联配信息中每一个残基对的最终关联性,根据该最终关联性生成该蛋白质多序列联配信息中残基间距离,基于该残基间距离构建蛋白质的三级结构。本发明直接从多序列联配学习残基间距离,因此可以提高残基间距离预测的精度,显著提高了蛋白质空间结构的预测精度。

Patent Agency Ranking