-
公开(公告)号:CN119719824A
公开(公告)日:2025-03-28
申请号:CN202411905282.X
申请日:2024-12-23
Applicant: 广东工业大学
IPC: G06F18/2321 , G06F18/21 , G06F18/10
Abstract: 本发明公开了一种基于双空间学习的分类数据聚类方法及系统,包括以下步骤:S1、接收并预处理包含多个分类属性的数据集,对分类属性值进行统一格式编码转换,初始化聚类归属矩阵和度量权重。S2、构造新的度量函数,动态调整度量空间权重,最小化聚类目标函数,通过交替迭代优化权重和聚类划分。S3、优化属性子空间权重,评估属性在聚类中的重要性,定义聚类紧致性,并使用Hellinger距离衡量属性的聚类可分性,计算属性权重。S4、结合度量空间学习与属性值子空间学习,协同更新度量权重和属性权重,优化目标函数,实现分类数据的聚类。本申请与传统技术相比,能够自适应调整度量和属性权重,克服了固定规则的局限,显著提高了聚类性能和泛化能力。