-
公开(公告)号:CN119400239A
公开(公告)日:2025-02-07
申请号:CN202411990089.0
申请日:2024-12-31
Applicant: 苏州大学
IPC: G16B20/20 , G16B40/00 , G06F18/24 , G06N3/0464 , G06N3/044 , G06N3/0895
Abstract: 本发明涉及生物信息学技术领域,具体提供了一种基于对比学习的剪接变异体致病性预测方法及系统,仅使用剪切变异体变异前后的DNA序列信息,极大简化了模型的特征输入。经过DNA预训练模型获取序列信息的嵌入,再通过一个对比学习模块进行处理,对于变异后表现为致病性的变异体,对比学习模块将其处理为差异性更大的嵌入;对于变异后为良性的变异体,则是减小二者的区别,使分类器更容易捕捉到其中的细微区别,进而实现高效的致病性预测。本发明直接从序列中学习,减少了因特征选择不同而导致的模型偏差,避免生物特征计算中引入的额外误差,在盲测集上的性能表明模型可准确预测致病性变异,同时兼具平衡性、良好的泛化性和鲁棒性。