-
公开(公告)号:CN109948720A
公开(公告)日:2019-06-28
申请号:CN201910237841.7
申请日:2019-03-27
Applicant: 重庆大学
IPC: G06K9/62
Abstract: 本发明公开一种基于密度的层次聚类方法,包括以下几个步骤:S1:计算数据集中每个样本点的自然邻居数量;S2:根据自然邻居数量获得K值;S3:根据k值获取每个样本点的最近邻集合;S4:计算样本点的相对近邻核密度,得到密度值集合;S5:根据相对近邻核密度对数据集中样本点进行分类得到高密度点集合和低密度点集合;S6:将低密度点分配给高密度点,分别得到相对应高密度点的第一子簇,从而得到第一簇集合;S7:将第一簇集合中的第一子簇进行合并得到第二簇集合;S8:将剩余样本点分配到第二簇集合,得到第三簇集合。本发明能够有效解决聚类算法中参数的选择问题,避免人为设置参数带来的实验主观因素影响。
-
公开(公告)号:CN109697471A
公开(公告)日:2019-04-30
申请号:CN201811617176.6
申请日:2018-12-28
Applicant: 重庆大学
IPC: G06K9/62
Abstract: 本发明公开一种基于KNN的密度峰值聚类方法,包括以下几个步骤:S1:通过自然邻居搜索算法得到数据集中每个样本点的K值;S2:计算数据集中每个样本点的K个近邻信息,得到第一聚类集合;S3:计算第一聚类集合中每个样本点的密度,对密度进行降序排列,标记排列前G的密度对应的样本点为核心点,对核心点进行分类形成第二聚类集合;S4:对数据集中所有样本点进行分配,得到第三聚类集合。本发明能有效解决Club算法中平均值接近0或者小于0的数据集的K值无法计算的问题,同时将非核心点的分配采取两步分配策略,提高聚类的精度。
-