-
公开(公告)号:CN119252497A
公开(公告)日:2025-01-03
申请号:CN202411301630.2
申请日:2024-09-18
Applicant: 福建师范大学
IPC: G16H50/70 , G06F18/23 , G06F17/15 , G06F17/16 , G06N3/042 , G06N3/0455 , G06N3/0464 , G06N3/096
Abstract: 本发明涉及一种基于卷积自编码器和知识蒸馏的多视图癌症亚型数据聚类方法,属于机器学习领域。该方法包括:使用皮尔逊相关系数对多组学数据的特征进行重新排列,减少数据的冗余性并提高特征的代表性。将重新排列后的多组学数据输入卷积自编码器模型,训练教师模型以捕捉数据的高维结构和特征。使用知识蒸馏算法将教师模型中的知识传递给一个较轻量级的学生模型,通过优化损失函数(包括重建误差和蒸馏损失)来训练学生模型。基于训练好的学生模型,使用KL散度对多视图癌症亚型数据进行聚类分析,得到最终的聚类结果。