-
公开(公告)号:CN113205124A
公开(公告)日:2021-08-03
申请号:CN202110457361.9
申请日:2021-04-27
Applicant: 哈尔滨工业大学(深圳)
IPC: G06K9/62 , G06F16/2458 , G06F16/215
Abstract: 本发明提供了一种基于密度峰值的高维真实场景下的聚类方法、系统及存储介质,该聚类方法包括步骤1:采集数据;步骤2:对采集的数据进行清洗操作;步骤3:计算近邻参数K、局部密度、密度权重以及边界度;步骤4:使用CSM模型确定聚类中心;步骤5:划分剩余数据对象;步骤6:依据划分结果,整理出辅助决策的可用信息;步骤7:输出可用信息。本发明的有益效果是:本发明解决了参数设置不合理导致的密度度量失衡问题,解决了中心选取偏差和参数敏感的问题,且具有良好的鲁棒性,可以对含有噪声的多密度和高维数据集进行有效的聚类,并具有较高的精度。
-
公开(公告)号:CN113205124B
公开(公告)日:2024-08-23
申请号:CN202110457361.9
申请日:2021-04-27
Applicant: 哈尔滨工业大学(深圳)
IPC: G06F18/23213 , G06F18/214 , G06F16/2458 , G06F16/215
Abstract: 本发明提供了一种基于密度峰值的高维真实场景下的聚类方法、系统及存储介质,该聚类方法包括步骤1:采集数据;步骤2:对采集的数据进行清洗操作;步骤3:计算近邻参数K、局部密度、密度权重以及边界度;步骤4:使用CSM模型确定聚类中心;步骤5:划分剩余数据对象;步骤6:依据划分结果,整理出辅助决策的可用信息;步骤7:输出可用信息。本发明的有益效果是:本发明解决了参数设置不合理导致的密度度量失衡问题,解决了中心选取偏差和参数敏感的问题,且具有良好的鲁棒性,可以对含有噪声的多密度和高维数据集进行有效的聚类,并具有较高的精度。
-
公开(公告)号:CN115147632B
公开(公告)日:2025-05-27
申请号:CN202210800775.1
申请日:2022-07-08
Applicant: 哈尔滨工业大学(深圳)
IPC: G06V10/762 , G06V10/82 , G06V20/70 , G06N3/0464 , G06N3/0455 , G06N3/08
Abstract: 本发明公开一种基于密度峰值聚类算法的图像类别自动标注方法及装置,包括卷积自编码器模型训练和卷积编码器‑聚类联合训练,将待标注的图像数据集输入到模型训练卷积自编码器模块,然后取出训练好的卷积编码器模块,将图像数据降维到低维特征向量空间;将低维特征向量输入到卷积编码器‑聚类联合训练模块,在特征向量空间使用密度峰值聚类方法选择候选聚类中心并找到高置信度数据集合,将高置信度数据集合类别作为真实标签训练卷积编码器模块,得到可信度高的聚类结果,最后用特征向量类别对输入的无标签图像数据进行类别标注。本发明可对无标签图像数据实现自动类别标注,解决了当前人工标注类别耗时长、成本高、准确率低、效率差的问题。
-
公开(公告)号:CN115375906A
公开(公告)日:2022-11-22
申请号:CN202210319737.4
申请日:2022-03-29
Applicant: 哈尔滨工业大学(深圳)
IPC: G06V10/40 , G06V10/762 , G06V10/776 , G06K9/62
Abstract: 本发明提供了一种基于空间向量分解的边界剥离聚类方法及系统,该边界剥离聚类方法包括:步骤1,输入步骤:输入数据集合;步骤2,边界剥离步骤:根据对象邻域分布特征判别对象类型,以剥离边界点;步骤3,簇骨架构建步骤:依据传递闭包关系确定簇的骨架;步骤4,边界关联步骤:建立边界与簇骨架之间的隶属关系完成聚类;步骤5,输出步骤:输出聚类结果。本发明的有益效果是:本发明不仅解决了现有边界剥离聚类倾向于分布均匀、球形簇的局限,同时提升了本发明在复杂分布、高维数据下的表现。
-
公开(公告)号:CN115147632A
公开(公告)日:2022-10-04
申请号:CN202210800775.1
申请日:2022-07-08
Applicant: 哈尔滨工业大学(深圳)
IPC: G06V10/762 , G06V10/82 , G06V20/70 , G06N3/04 , G06N3/08
Abstract: 本发明公开一种基于密度峰值聚类算法的图像类别自动标注方法及装置,包括卷积自编码器模型训练和卷积编码器‑聚类联合训练,将待标注的图像数据集输入到模型训练卷积自编码器模块,然后取出训练好的卷积编码器模块,将图像数据降维到低维特征向量空间;将低维特征向量输入到卷积编码器‑聚类联合训练模块,在特征向量空间使用密度峰值聚类方法选择候选聚类中心并找到高置信度数据集合,将高置信度数据集合类别作为真实标签训练卷积编码器模块,得到可信度高的聚类结果,最后用特征向量类别对输入的无标签图像数据进行类别标注。本发明可对无标签图像数据实现自动类别标注,解决了当前人工标注类别耗时长、成本高、准确率低、效率差的问题。
-
-
-
-