-
公开(公告)号:CN117894372A
公开(公告)日:2024-04-16
申请号:CN202410050281.5
申请日:2024-01-12
Applicant: 北京大学
Abstract: 本发明提供一种基于深度学习的16S rRNA基因测序引物设计方法及系统,涉及引物设计技术领域。首先获取目标细菌群落相关的属列表,基于属列表得到代表性16S rRNA基因全长序列,利用预先训练的区域划分模型预测代表性全长序列的各个可变区域及保守区域,确定符合测序平台要求的候选扩增区域用于引物设计,针对每个候选扩增区域确定对应的正向引物结合区序列集和反向引物结合区序列集,基于两种序列集分别进行多序列比对得到候选特异性引物对,最后筛选得到目标细菌群落特异性引物对。本发明无需进行16S rRNA基因全长序列多序列比对,直接基于区域划分模型划分确定出候选扩增区域进行多序列比对,可有效节省运算时间和使用内存,提高引物设计流程的整体效率。