一种深度图像聚类方法、系统及存储介质

    公开(公告)号:CN116342915B

    公开(公告)日:2024-06-25

    申请号:CN202310621703.5

    申请日:2023-05-30

    Abstract: 本发明提供了一种深度图像聚类方法、系统及存储介质,该方法包括以下步骤:步骤一:将含有n个样本的图像数据集输入编码器;步骤二:编码器将输入的原始图像转化为低维嵌入特征,再分别输出给解码器和维度约减模块,解码器将低维嵌入特征恢复为原始图像,维度约减模块将所接收的低维嵌入特征转化为聚类友好的二维表示,形成聚类空间,并输出给聚类划分模块;步骤三:聚类划分模块根据每个样本的低维嵌入特征将图像数据集中的n个样本划分为K个子簇,得到聚类结果。本发明的有益效果是:本发明的深度图像聚类方法TDEC是鲁棒的,可以对多簇、大规模、复杂背景等场景下的图像数据聚类,并且聚类精度明显高于现有的先进方法。

    一种深度图像聚类方法、系统及存储介质

    公开(公告)号:CN116342915A

    公开(公告)日:2023-06-27

    申请号:CN202310621703.5

    申请日:2023-05-30

    Abstract: 本发明提供了一种深度图像聚类方法、系统及存储介质,该方法包括以下步骤:步骤一:将含有n个样本的图像数据集输入编码器;步骤二:编码器将输入的原始图像转化为低维嵌入特征,再分别输出给解码器和维度约减模块,解码器将低维嵌入特征恢复为原始图像,维度约减模块将所接收的低维嵌入特征转化为聚类友好的二维表示,形成聚类空间,并输出给聚类划分模块;步骤三:聚类划分模块根据每个样本的低维嵌入特征将图像数据集中的n个样本划分为K个子簇,得到聚类结果。本发明的有益效果是:本发明的深度图像聚类方法TDEC是鲁棒的,可以对多簇、大规模、复杂背景等场景下的图像数据聚类,并且聚类精度明显高于现有的先进方法。

    基于中心匹配的簇数量确定方法、装置、设备及存储介质

    公开(公告)号:CN115293295A

    公开(公告)日:2022-11-04

    申请号:CN202211170302.4

    申请日:2022-09-26

    Abstract: 本发明涉及数据挖掘领域,公开了一种基于中心匹配的簇数量确定方法、装置、设备及存储介质,该方法包括:将原始数据集转换为原始向量数据集;根据原始向量数据集确定边界数据,并删除原始数据集中的边界数据,获得核心数据集;根据核心数据集确定密度峰值集和均值中心集;基于密度峰值集和均值中心集确定最佳簇数量。由于本发明是通过对比来自不同源的高代表性数据的位置行为来确定最佳簇数量而非直接定义,相比于现有技术中通过预先定义聚类有效性指标,然后对完整聚类结果进行迭代式评分来确定最佳簇数量,本发明避免了边界数据的消极影响,并且无需进行大量迭代,能够准确快速地确定最佳簇数量。

    一种基于密度峰值的高维真实场景下的聚类方法、系统及存储介质

    公开(公告)号:CN113205124A

    公开(公告)日:2021-08-03

    申请号:CN202110457361.9

    申请日:2021-04-27

    Abstract: 本发明提供了一种基于密度峰值的高维真实场景下的聚类方法、系统及存储介质,该聚类方法包括步骤1:采集数据;步骤2:对采集的数据进行清洗操作;步骤3:计算近邻参数K、局部密度、密度权重以及边界度;步骤4:使用CSM模型确定聚类中心;步骤5:划分剩余数据对象;步骤6:依据划分结果,整理出辅助决策的可用信息;步骤7:输出可用信息。本发明的有益效果是:本发明解决了参数设置不合理导致的密度度量失衡问题,解决了中心选取偏差和参数敏感的问题,且具有良好的鲁棒性,可以对含有噪声的多密度和高维数据集进行有效的聚类,并具有较高的精度。

    基于密度峰值聚类算法的图像类别自动标注方法及装置

    公开(公告)号:CN115147632B

    公开(公告)日:2025-05-27

    申请号:CN202210800775.1

    申请日:2022-07-08

    Abstract: 本发明公开一种基于密度峰值聚类算法的图像类别自动标注方法及装置,包括卷积自编码器模型训练和卷积编码器‑聚类联合训练,将待标注的图像数据集输入到模型训练卷积自编码器模块,然后取出训练好的卷积编码器模块,将图像数据降维到低维特征向量空间;将低维特征向量输入到卷积编码器‑聚类联合训练模块,在特征向量空间使用密度峰值聚类方法选择候选聚类中心并找到高置信度数据集合,将高置信度数据集合类别作为真实标签训练卷积编码器模块,得到可信度高的聚类结果,最后用特征向量类别对输入的无标签图像数据进行类别标注。本发明可对无标签图像数据实现自动类别标注,解决了当前人工标注类别耗时长、成本高、准确率低、效率差的问题。

    基于空间向量分解的边界剥离聚类方法及系统

    公开(公告)号:CN115375906A

    公开(公告)日:2022-11-22

    申请号:CN202210319737.4

    申请日:2022-03-29

    Abstract: 本发明提供了一种基于空间向量分解的边界剥离聚类方法及系统,该边界剥离聚类方法包括:步骤1,输入步骤:输入数据集合;步骤2,边界剥离步骤:根据对象邻域分布特征判别对象类型,以剥离边界点;步骤3,簇骨架构建步骤:依据传递闭包关系确定簇的骨架;步骤4,边界关联步骤:建立边界与簇骨架之间的隶属关系完成聚类;步骤5,输出步骤:输出聚类结果。本发明的有益效果是:本发明不仅解决了现有边界剥离聚类倾向于分布均匀、球形簇的局限,同时提升了本发明在复杂分布、高维数据下的表现。

    基于密度峰值聚类算法的图像类别自动标注方法及装置

    公开(公告)号:CN115147632A

    公开(公告)日:2022-10-04

    申请号:CN202210800775.1

    申请日:2022-07-08

    Abstract: 本发明公开一种基于密度峰值聚类算法的图像类别自动标注方法及装置,包括卷积自编码器模型训练和卷积编码器‑聚类联合训练,将待标注的图像数据集输入到模型训练卷积自编码器模块,然后取出训练好的卷积编码器模块,将图像数据降维到低维特征向量空间;将低维特征向量输入到卷积编码器‑聚类联合训练模块,在特征向量空间使用密度峰值聚类方法选择候选聚类中心并找到高置信度数据集合,将高置信度数据集合类别作为真实标签训练卷积编码器模块,得到可信度高的聚类结果,最后用特征向量类别对输入的无标签图像数据进行类别标注。本发明可对无标签图像数据实现自动类别标注,解决了当前人工标注类别耗时长、成本高、准确率低、效率差的问题。

    一种基于密度峰值的高维真实场景下的聚类方法、系统及存储介质

    公开(公告)号:CN113205124B

    公开(公告)日:2024-08-23

    申请号:CN202110457361.9

    申请日:2021-04-27

    Abstract: 本发明提供了一种基于密度峰值的高维真实场景下的聚类方法、系统及存储介质,该聚类方法包括步骤1:采集数据;步骤2:对采集的数据进行清洗操作;步骤3:计算近邻参数K、局部密度、密度权重以及边界度;步骤4:使用CSM模型确定聚类中心;步骤5:划分剩余数据对象;步骤6:依据划分结果,整理出辅助决策的可用信息;步骤7:输出可用信息。本发明的有益效果是:本发明解决了参数设置不合理导致的密度度量失衡问题,解决了中心选取偏差和参数敏感的问题,且具有良好的鲁棒性,可以对含有噪声的多密度和高维数据集进行有效的聚类,并具有较高的精度。

Patent Agency Ranking