-
公开(公告)号:CN112863598A
公开(公告)日:2021-05-28
申请号:CN202110266696.2
申请日:2021-03-11
Applicant: 同济大学
Abstract: 本发明公开一种基于深度学习的DNA序列基元挖掘方法和系统,其包括:步骤1、对获取的DNA序列进行预处理,采用重叠分割策略将每条DNA序列处理成一个数据包,采用k‑mer编码对数据包里的每一个示例进行编码;步骤2、对每个数据包进行特征学习,以构造混合深度神经网络模型,对数据包中每个示例进行预测打分;步骤3、对每个数据包中所有示例进行融合,将融合后的得分作为该数据包的最终预测值。采用本发明的技方案,避免忽略基因组序列的弱监督信息、序列特征之间的长期依赖关系等。