-
公开(公告)号:CN118430651A
公开(公告)日:2024-08-02
申请号:CN202410503680.2
申请日:2024-04-24
Applicant: 哈尔滨工业大学
IPC: G16B30/10 , G16B40/00 , G16B50/30 , G06F16/901 , G06F16/9032
Abstract: 本发明提出了一种网络生物数据物种分类识别系统,包括文件类型识别模块、索引构建模块、序列比对与分类模块、物种分类识别比对结果分析模块。索引构建模块允许用户根据需要调节系统的审查严格程度与速度,通过选择增加或减少参考物种的数量来构建索引。序列比对和分类模块通过采用多线程架构和高效的优化的比对算法,生成标准的SAM格式结果。数据统计和分析模块进一步分析这些结果,使用最近公共祖先(LCA)算法确保提供准确的物种识别信息。该系统利用深度学习技术与基于规则的方法识别传入的生物数据文件类型,确保只处理目标生物数据,优化了生物数据的处理流程,提高了数据处理的效率和精确性,特别适合需要高度数据安全和快速响应的应用场景。