-
公开(公告)号:CN116342915B
公开(公告)日:2024-06-25
申请号:CN202310621703.5
申请日:2023-05-30
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
IPC: G06V10/762 , G06V10/77 , G06T7/50
Abstract: 本发明提供了一种深度图像聚类方法、系统及存储介质,该方法包括以下步骤:步骤一:将含有n个样本的图像数据集输入编码器;步骤二:编码器将输入的原始图像转化为低维嵌入特征,再分别输出给解码器和维度约减模块,解码器将低维嵌入特征恢复为原始图像,维度约减模块将所接收的低维嵌入特征转化为聚类友好的二维表示,形成聚类空间,并输出给聚类划分模块;步骤三:聚类划分模块根据每个样本的低维嵌入特征将图像数据集中的n个样本划分为K个子簇,得到聚类结果。本发明的有益效果是:本发明的深度图像聚类方法TDEC是鲁棒的,可以对多簇、大规模、复杂背景等场景下的图像数据聚类,并且聚类精度明显高于现有的先进方法。
-
公开(公告)号:CN117557833A
公开(公告)日:2024-02-13
申请号:CN202311388617.0
申请日:2023-10-24
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
IPC: G06V10/764 , G06V10/74 , G06V10/762 , G06V10/774 , G06V10/82 , G06N3/0464 , G06N3/09 , G06F9/50
Abstract: 本发明公开一种基于课程学习和深度学习的图像标注方法及装置,方法包括:获取并预处理无标签图片,形成数据集;构建自编码器,将数据集转换嵌入特征并对自编码器进行预训练;对自编码器进行微调训练;根据嵌入特征的聚类结果,利用训练好的自编码器找到每个簇对应的密度核,并根据密度核确认标签类别,获取图像标注结果。本发明设计了一种自编码器,通过包括计算难度分数、课程生成和基于密度核的聚类划分的微调训练,提出了一种新的图像标注方法,最大限度地减少了计算资源的消耗,同时加快模型收敛和提高算法鲁棒性。
-
公开(公告)号:CN116342915A
公开(公告)日:2023-06-27
申请号:CN202310621703.5
申请日:2023-05-30
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
IPC: G06V10/762 , G06V10/77 , G06T7/50
Abstract: 本发明提供了一种深度图像聚类方法、系统及存储介质,该方法包括以下步骤:步骤一:将含有n个样本的图像数据集输入编码器;步骤二:编码器将输入的原始图像转化为低维嵌入特征,再分别输出给解码器和维度约减模块,解码器将低维嵌入特征恢复为原始图像,维度约减模块将所接收的低维嵌入特征转化为聚类友好的二维表示,形成聚类空间,并输出给聚类划分模块;步骤三:聚类划分模块根据每个样本的低维嵌入特征将图像数据集中的n个样本划分为K个子簇,得到聚类结果。本发明的有益效果是:本发明的深度图像聚类方法TDEC是鲁棒的,可以对多簇、大规模、复杂背景等场景下的图像数据聚类,并且聚类精度明显高于现有的先进方法。
-
公开(公告)号:CN115293295A
公开(公告)日:2022-11-04
申请号:CN202211170302.4
申请日:2022-09-26
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
IPC: G06K9/62
Abstract: 本发明涉及数据挖掘领域,公开了一种基于中心匹配的簇数量确定方法、装置、设备及存储介质,该方法包括:将原始数据集转换为原始向量数据集;根据原始向量数据集确定边界数据,并删除原始数据集中的边界数据,获得核心数据集;根据核心数据集确定密度峰值集和均值中心集;基于密度峰值集和均值中心集确定最佳簇数量。由于本发明是通过对比来自不同源的高代表性数据的位置行为来确定最佳簇数量而非直接定义,相比于现有技术中通过预先定义聚类有效性指标,然后对完整聚类结果进行迭代式评分来确定最佳簇数量,本发明避免了边界数据的消极影响,并且无需进行大量迭代,能够准确快速地确定最佳簇数量。
-
公开(公告)号:CN113205124A
公开(公告)日:2021-08-03
申请号:CN202110457361.9
申请日:2021-04-27
Applicant: 哈尔滨工业大学(深圳)
IPC: G06K9/62 , G06F16/2458 , G06F16/215
Abstract: 本发明提供了一种基于密度峰值的高维真实场景下的聚类方法、系统及存储介质,该聚类方法包括步骤1:采集数据;步骤2:对采集的数据进行清洗操作;步骤3:计算近邻参数K、局部密度、密度权重以及边界度;步骤4:使用CSM模型确定聚类中心;步骤5:划分剩余数据对象;步骤6:依据划分结果,整理出辅助决策的可用信息;步骤7:输出可用信息。本发明的有益效果是:本发明解决了参数设置不合理导致的密度度量失衡问题,解决了中心选取偏差和参数敏感的问题,且具有良好的鲁棒性,可以对含有噪声的多密度和高维数据集进行有效的聚类,并具有较高的精度。
-
公开(公告)号:CN115147632B
公开(公告)日:2025-05-27
申请号:CN202210800775.1
申请日:2022-07-08
Applicant: 哈尔滨工业大学(深圳)
IPC: G06V10/762 , G06V10/82 , G06V20/70 , G06N3/0464 , G06N3/0455 , G06N3/08
Abstract: 本发明公开一种基于密度峰值聚类算法的图像类别自动标注方法及装置,包括卷积自编码器模型训练和卷积编码器‑聚类联合训练,将待标注的图像数据集输入到模型训练卷积自编码器模块,然后取出训练好的卷积编码器模块,将图像数据降维到低维特征向量空间;将低维特征向量输入到卷积编码器‑聚类联合训练模块,在特征向量空间使用密度峰值聚类方法选择候选聚类中心并找到高置信度数据集合,将高置信度数据集合类别作为真实标签训练卷积编码器模块,得到可信度高的聚类结果,最后用特征向量类别对输入的无标签图像数据进行类别标注。本发明可对无标签图像数据实现自动类别标注,解决了当前人工标注类别耗时长、成本高、准确率低、效率差的问题。
-
公开(公告)号:CN115375906A
公开(公告)日:2022-11-22
申请号:CN202210319737.4
申请日:2022-03-29
Applicant: 哈尔滨工业大学(深圳)
IPC: G06V10/40 , G06V10/762 , G06V10/776 , G06K9/62
Abstract: 本发明提供了一种基于空间向量分解的边界剥离聚类方法及系统,该边界剥离聚类方法包括:步骤1,输入步骤:输入数据集合;步骤2,边界剥离步骤:根据对象邻域分布特征判别对象类型,以剥离边界点;步骤3,簇骨架构建步骤:依据传递闭包关系确定簇的骨架;步骤4,边界关联步骤:建立边界与簇骨架之间的隶属关系完成聚类;步骤5,输出步骤:输出聚类结果。本发明的有益效果是:本发明不仅解决了现有边界剥离聚类倾向于分布均匀、球形簇的局限,同时提升了本发明在复杂分布、高维数据下的表现。
-
公开(公告)号:CN115147632A
公开(公告)日:2022-10-04
申请号:CN202210800775.1
申请日:2022-07-08
Applicant: 哈尔滨工业大学(深圳)
IPC: G06V10/762 , G06V10/82 , G06V20/70 , G06N3/04 , G06N3/08
Abstract: 本发明公开一种基于密度峰值聚类算法的图像类别自动标注方法及装置,包括卷积自编码器模型训练和卷积编码器‑聚类联合训练,将待标注的图像数据集输入到模型训练卷积自编码器模块,然后取出训练好的卷积编码器模块,将图像数据降维到低维特征向量空间;将低维特征向量输入到卷积编码器‑聚类联合训练模块,在特征向量空间使用密度峰值聚类方法选择候选聚类中心并找到高置信度数据集合,将高置信度数据集合类别作为真实标签训练卷积编码器模块,得到可信度高的聚类结果,最后用特征向量类别对输入的无标签图像数据进行类别标注。本发明可对无标签图像数据实现自动类别标注,解决了当前人工标注类别耗时长、成本高、准确率低、效率差的问题。
-
公开(公告)号:CN113205124B
公开(公告)日:2024-08-23
申请号:CN202110457361.9
申请日:2021-04-27
Applicant: 哈尔滨工业大学(深圳)
IPC: G06F18/23213 , G06F18/214 , G06F16/2458 , G06F16/215
Abstract: 本发明提供了一种基于密度峰值的高维真实场景下的聚类方法、系统及存储介质,该聚类方法包括步骤1:采集数据;步骤2:对采集的数据进行清洗操作;步骤3:计算近邻参数K、局部密度、密度权重以及边界度;步骤4:使用CSM模型确定聚类中心;步骤5:划分剩余数据对象;步骤6:依据划分结果,整理出辅助决策的可用信息;步骤7:输出可用信息。本发明的有益效果是:本发明解决了参数设置不合理导致的密度度量失衡问题,解决了中心选取偏差和参数敏感的问题,且具有良好的鲁棒性,可以对含有噪声的多密度和高维数据集进行有效的聚类,并具有较高的精度。
-
-
-
-
-
-
-
-