-
公开(公告)号:CN118824360A
公开(公告)日:2024-10-22
申请号:CN202410829161.5
申请日:2024-06-25
Applicant: 哈尔滨工业大学
IPC: G16B20/20 , G16B20/30 , G06F18/213 , G06F18/23 , G06F18/214 , G06F18/243 , G06N5/01 , G06N20/00 , G06N3/0464 , G16B40/00
Abstract: 一种基于长读测序数据和假阳性过滤模型的基因组结构变异检测方法,它属于生物信息领域。本发明解决了现有方法对长读测序数据中SV检测的准确率低的问题。本发明以个体长读测序数据作为输入,通过与参考基因组的比对初步获得SV信号,再将随机森林网络和卷积神经网络作为假阳性过滤模型,并重新设计SV信号的聚类方法,从初步获得的SV信号中过滤掉假阳性SV信号,可以有效降低假阳性事件的调用可能性,具备快速、准确地检测来自多种长读测序平台和各类SV信号的能力。本发明方法可以应用于长读测序数据的基因组结构变异检测。