一种基于改进编码表与HMSA的DNA信息存储方法

    公开(公告)号:CN117912563A

    公开(公告)日:2024-04-19

    申请号:CN202410029618.4

    申请日:2024-01-08

    Abstract: 本发明提出了一种基于改进编码表与HMSA的DNA信息存储方法,步骤如下:受Meinolf Blawat的启发,将改进的映射规则用于构建与ASCLL码一一对应的编码表;根据构建的编码表将待存储的信息编码为碱基序列;利用HMSA进行纠错:比较Reads与设计序列的长度,分成三组分别对每组进行纠正;计算每组碱基片段与编码表中的碱基片段之间的最小汉明距离,找出第一个最小汉明距离不为0的碱基片段组,进行初步纠正;将完成初步纠正的碱基序列对齐放在一起后使用多序列比对方法再次进行错误纠正;使用编码表将纠正后的Reads每5位碱基切片划分后解码为存储的信息。本发明不仅可以有效的纠正DNA序列中替换错误,也可以纠正DNA序列中部分的插入和删除错误。

    一种GC含量及均聚物可控的DNA数据存储方法

    公开(公告)号:CN117095758A

    公开(公告)日:2023-11-21

    申请号:CN202311143503.X

    申请日:2023-09-05

    Abstract: 本发明提出了一种GC含量及均聚物可控的DNA数据存储方法,步骤如下:对原始文本进行LZW压缩,并将LZW压缩后的文本转换为二进制码流;在二进制码流中添加RS纠错码生成带纠错码的二进制码流;利用逻辑映射产生的混沌序列对带有纠错码的二进制码流进行加扰处理,得到新的二进制序列;每四种碱基为一个映射单位,从碱基排列集合中选择64种符合约束条件的映射元素形成的64元编码映射表,使用64元编码映射表将二进制序列转码为DNA序列。本发明在DNA存储过程中充分考虑了数据稳定性、解码准确性和成本效益,对莎士比亚十四行诗测试,验证了可行性和有效性。实验结果显示,本发明编码DNA序列的GC含量保持在50%,均聚物长度不超过2。

Patent Agency Ranking