-
公开(公告)号:CN118585840A
公开(公告)日:2024-09-03
申请号:CN202410922820.X
申请日:2024-07-10
Applicant: 济南大学
IPC: G06F18/23 , G06F18/214 , G06F17/11 , G06F18/25 , G06N5/04
Abstract: 本发明属于数据挖掘技术领域,提供了基于多重填充及变分网络的不完全数据聚类方法及系统,包括获取待聚类的不完全数据集;对缺失数据进行多重推断,得到多个填充结果;将填充结果编码为潜在表示,融合潜在分布,得到共享潜在分布;从高斯混合模型中选择一个聚类,根据所选聚类产生共享潜在变量,利用高斯混合模型计算聚类分配概率;定义目标函数,计算前后两次迭代的目标函数值之间的差值,如果满足设定条件,则终止迭代,如果不满足则重复执行上述步骤。本发明解决了传统的不完全数据聚类方法填充与聚类部分分离、推断过程无法获得足够的信息来处理高维数据的问题。