-
公开(公告)号:CN116383682A
公开(公告)日:2023-07-04
申请号:CN202310268227.3
申请日:2023-03-17
Applicant: 广东工业大学
IPC: G06F18/2321 , G06F18/23213
Abstract: 本发明涉及密度峰值聚类技术领域,公开了一种基于k近邻密度支配域代表团的密度峰值聚类方法,通过使用支配域的密度和支配域间的支配距离快速获得簇心密度支配域,再利用支配关系构建的密度支配树,以K个簇心密度支配域为聚类中心,由上到下实现聚类,实现指定数目为K的聚类,同时以采样中心峰值区域作为密度峰值处产生的代表团,估计边缘节点数量,组成支配域代表团,提升代表点代能力,能够代表一个密度支配域的分布状况,本发明在不失密度支配域的快速聚类特征同时,也保证了聚类质量,更满足指定数目为K的聚类需求,关键参数也只有一个近邻数k,操作方便,对聚类分析工作具有一定的实用性。
-
公开(公告)号:CN113159233A
公开(公告)日:2021-07-23
申请号:CN202110560658.8
申请日:2021-05-21
Applicant: 广东工业大学
IPC: G06K9/62
Abstract: 本发明提出一种谱聚类加速方法、系统、计算机设备及存储介质,解决了当前谱聚类方法中,优秀锚点选取和K均值计算耗时长的问题,本发明提出一种谱聚类加速方法、系统、计算机设备及存储介质,相对于传统近似谱聚类通过选取的锚点和原始数据点构建的稀疏表示矩阵Z构建ZZT来近似表示拉普拉斯图矩阵,然后获得其相对应的特征向量进行K均值聚类,获得最终聚类结果矩阵的方法,本发明不须最后的K均值聚类,实际在待谱聚类的原始数据规模较大时,K均值聚类耗费时间长,本发明将K均值运算规模从所有点变成了锚点,减少优秀锚点的获取时间,在保证一定准确率的前提下,减少谱聚类近似算法计算时间,特别是大规模谱聚类问题,能大幅减少运算时间。
-