-
公开(公告)号:CN118585840A
公开(公告)日:2024-09-03
申请号:CN202410922820.X
申请日:2024-07-10
Applicant: 济南大学
IPC: G06F18/23 , G06F18/214 , G06F17/11 , G06F18/25 , G06N5/04
Abstract: 本发明属于数据挖掘技术领域,提供了基于多重填充及变分网络的不完全数据聚类方法及系统,包括获取待聚类的不完全数据集;对缺失数据进行多重推断,得到多个填充结果;将填充结果编码为潜在表示,融合潜在分布,得到共享潜在分布;从高斯混合模型中选择一个聚类,根据所选聚类产生共享潜在变量,利用高斯混合模型计算聚类分配概率;定义目标函数,计算前后两次迭代的目标函数值之间的差值,如果满足设定条件,则终止迭代,如果不满足则重复执行上述步骤。本发明解决了传统的不完全数据聚类方法填充与聚类部分分离、推断过程无法获得足够的信息来处理高维数据的问题。
-
公开(公告)号:CN118779676A
公开(公告)日:2024-10-15
申请号:CN202410943885.2
申请日:2024-07-15
Applicant: 济南大学
IPC: G06F18/23 , G06F18/15 , G06F18/25 , G06N3/045 , G06N3/0455 , G06N3/0475 , G06N3/0895 , G06N3/094
Abstract: 本公开提出一种融合多重填充和注意力机制的对比不完全数据聚类方法,包括:采用链式方程多重填充算法对原始不完整数据集进行填充,得到具有多视图数据的填充数据集;将填充数据集输入自编码器中,基于编码器得到每个视图的潜在特征;采用注意力机制融合每个视图的潜在特征,得到融合潜在特征;将融合潜在特征输入解码器,得到重构特征;根据潜在特征和重构特征计算重构损失;基于映射的融合潜在特征中的正样本对和负样本对进行对比学习,计算对比学习损失;基于生成对抗网络对融合潜在特征进行聚类,计算聚类损失;根据损失函数对自编码器进行训练。提高了不完全数据填充的准确性、有效挖掘不同视图间的共享特征信息,提高聚类准确性。
-