-
公开(公告)号:CN105913077A
公开(公告)日:2016-08-31
申请号:CN201610213963.9
申请日:2016-04-07
Applicant: 华北电力大学(保定)
IPC: G06K9/62
CPC classification number: G06K9/6223
Abstract: 一种基于降维和抽样的数据聚类方法,所述方法首先通过分段均值法对数据集进行降维处理,然后构造随机函数从大规模的聚类数据集中进行随机抽样,得到规模较小的工作集,并在工作集上进行k?means聚类,得到随机抽样聚类结果,最后通过衡量剩下的聚类样本与已经得到的抽样聚类结果的关系,对剩余样本进行分类。本发明采用降维和抽样的方法减少参与迭代的数据集样本的数目和维度,在保持良好聚类效果的情况下,大大降低了k?means算法的复杂度,从而实现了大规模数据的高效聚类。