-
公开(公告)号:CN109697471A
公开(公告)日:2019-04-30
申请号:CN201811617176.6
申请日:2018-12-28
Applicant: 重庆大学
IPC: G06K9/62
Abstract: 本发明公开一种基于KNN的密度峰值聚类方法,包括以下几个步骤:S1:通过自然邻居搜索算法得到数据集中每个样本点的K值;S2:计算数据集中每个样本点的K个近邻信息,得到第一聚类集合;S3:计算第一聚类集合中每个样本点的密度,对密度进行降序排列,标记排列前G的密度对应的样本点为核心点,对核心点进行分类形成第二聚类集合;S4:对数据集中所有样本点进行分配,得到第三聚类集合。本发明能有效解决Club算法中平均值接近0或者小于0的数据集的K值无法计算的问题,同时将非核心点的分配采取两步分配策略,提高聚类的精度。