-
公开(公告)号:CN113035277A
公开(公告)日:2021-06-25
申请号:CN202110271328.7
申请日:2021-03-12
Applicant: 南开大学
Abstract: 本公开提供了一种真菌基因组测序数据自动分析方法及系统,包括:获取真菌基因组测序数据,判断测序数据类型;根据测序数据的类型分别进行相应预处理;将预处理后的测序数据进行组装,得到组装后的contigs;基于基因组序列对比对contigs的相似参考基因组进行初步筛选,获得候选参考基因组;利用MinHash数据结构从候选参考基因组中估算所述contigs的相似参考基因组,实现真菌基因组鉴定;并利用获得的相似参考基因组对所述contigs进行下游分析;实现真菌基因组测序数据的自动分析;所述方案基于序列比对和MinHash数据结构对真菌全基因组进行鉴定,可以在实现对真菌种类进行鉴定的同时,找到与真菌同源性最高的参考基因组,从而便于下游分析。
-
公开(公告)号:CN112863599A
公开(公告)日:2021-05-28
申请号:CN202110271331.9
申请日:2021-03-12
Applicant: 南开大学
IPC: G16B30/00
Abstract: 本发明公开一种病毒测序序列的自动化分析方法及系统,包括:对病毒测序序列经质量控制和序列组装后得到病毒基因组长序列;对病毒基因组长序列进行编码后采用预先训练的深度学习网络模型进行类型鉴定;根据病毒基因组长序列与参考基因组的序列比对进行病毒测序序列的注释。针对大量增长的病毒测序数据量以及硬盘空间被大量占用的问题,本发明引入深度学习构建鉴定模型,在实现病毒类型鉴定的同时,提供病毒注释功能。
-