-
公开(公告)号:CN118658523A
公开(公告)日:2024-09-17
申请号:CN202410602335.4
申请日:2024-05-15
Applicant: 重庆邮电大学
Abstract: 本发明公开了一种基于唯一分子标签聚类的低频DNA突变识别方法及装置,旨在提升高通量测序(next‑generation sequencing,NGS)数据中低频DNA突变识别的准确性和灵敏度。所述方法包括以下步骤:(1)预处理测序原始数据,提取UMI序列并建立其与测序读段的映射关系;(2)采用UMAP算法对UMI序列进行降维,采用HDBSCAN算法对UMI数据进行聚类;(3)对同一读段簇内的读段进行多序列比对后,基于熵值与互信息生成一致性序列;(4)将一致性序列与参考基因组比对后进行突变识别。本发明的方法和装置能有效提高低频DNA突变识别的准确度和效率,拟为癌症早筛早诊、产前诊断、法医检测等领域的遗传变异分析提供一种新策略。