一种聚类分析驱动的高精度缺失数据填补方法

    公开(公告)号:CN119513637A

    公开(公告)日:2025-02-25

    申请号:CN202411477670.2

    申请日:2024-10-22

    Abstract: 本发明提供了一种聚类分析驱动的高精度缺失数据填补方法,包括如下步骤:S1、获取包含缺失值的数据,对包含缺失值的数据进行预处理;S2、将数据矩阵X、掩模矩阵M、提示矩阵H、聚类标签C1输入至生成对抗网络中,经过非线性变换得到填补矩阵X’和概率矩阵P;S3、将填补矩阵X’输入到深度子空间聚类网络中,得到重建数据矩阵以及自表达层系数矩阵;S4、计算矩阵U和U的转置的乘积,调整后得到亲和矩阵A;S5、将样本分配到不同的簇中,输出新的聚类标签C2;S6、重复S2~S5,输出此时S2得到的填补矩阵X’作为高精度填补数据矩阵。本发明利用聚类分析技术捕获数据内部潜在结构与模式的特点,进一步提升了数据填补的精度和质量。

Patent Agency Ranking