-
公开(公告)号:CN116342915A
公开(公告)日:2023-06-27
申请号:CN202310621703.5
申请日:2023-05-30
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
IPC: G06V10/762 , G06V10/77 , G06T7/50
Abstract: 本发明提供了一种深度图像聚类方法、系统及存储介质,该方法包括以下步骤:步骤一:将含有n个样本的图像数据集输入编码器;步骤二:编码器将输入的原始图像转化为低维嵌入特征,再分别输出给解码器和维度约减模块,解码器将低维嵌入特征恢复为原始图像,维度约减模块将所接收的低维嵌入特征转化为聚类友好的二维表示,形成聚类空间,并输出给聚类划分模块;步骤三:聚类划分模块根据每个样本的低维嵌入特征将图像数据集中的n个样本划分为K个子簇,得到聚类结果。本发明的有益效果是:本发明的深度图像聚类方法TDEC是鲁棒的,可以对多簇、大规模、复杂背景等场景下的图像数据聚类,并且聚类精度明显高于现有的先进方法。
-
公开(公告)号:CN115293295A
公开(公告)日:2022-11-04
申请号:CN202211170302.4
申请日:2022-09-26
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
IPC: G06K9/62
Abstract: 本发明涉及数据挖掘领域,公开了一种基于中心匹配的簇数量确定方法、装置、设备及存储介质,该方法包括:将原始数据集转换为原始向量数据集;根据原始向量数据集确定边界数据,并删除原始数据集中的边界数据,获得核心数据集;根据核心数据集确定密度峰值集和均值中心集;基于密度峰值集和均值中心集确定最佳簇数量。由于本发明是通过对比来自不同源的高代表性数据的位置行为来确定最佳簇数量而非直接定义,相比于现有技术中通过预先定义聚类有效性指标,然后对完整聚类结果进行迭代式评分来确定最佳簇数量,本发明避免了边界数据的消极影响,并且无需进行大量迭代,能够准确快速地确定最佳簇数量。
-
公开(公告)号:CN116342915B
公开(公告)日:2024-06-25
申请号:CN202310621703.5
申请日:2023-05-30
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
IPC: G06V10/762 , G06V10/77 , G06T7/50
Abstract: 本发明提供了一种深度图像聚类方法、系统及存储介质,该方法包括以下步骤:步骤一:将含有n个样本的图像数据集输入编码器;步骤二:编码器将输入的原始图像转化为低维嵌入特征,再分别输出给解码器和维度约减模块,解码器将低维嵌入特征恢复为原始图像,维度约减模块将所接收的低维嵌入特征转化为聚类友好的二维表示,形成聚类空间,并输出给聚类划分模块;步骤三:聚类划分模块根据每个样本的低维嵌入特征将图像数据集中的n个样本划分为K个子簇,得到聚类结果。本发明的有益效果是:本发明的深度图像聚类方法TDEC是鲁棒的,可以对多簇、大规模、复杂背景等场景下的图像数据聚类,并且聚类精度明显高于现有的先进方法。
-
公开(公告)号:CN117557833A
公开(公告)日:2024-02-13
申请号:CN202311388617.0
申请日:2023-10-24
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
IPC: G06V10/764 , G06V10/74 , G06V10/762 , G06V10/774 , G06V10/82 , G06N3/0464 , G06N3/09 , G06F9/50
Abstract: 本发明公开一种基于课程学习和深度学习的图像标注方法及装置,方法包括:获取并预处理无标签图片,形成数据集;构建自编码器,将数据集转换嵌入特征并对自编码器进行预训练;对自编码器进行微调训练;根据嵌入特征的聚类结果,利用训练好的自编码器找到每个簇对应的密度核,并根据密度核确认标签类别,获取图像标注结果。本发明设计了一种自编码器,通过包括计算难度分数、课程生成和基于密度核的聚类划分的微调训练,提出了一种新的图像标注方法,最大限度地减少了计算资源的消耗,同时加快模型收敛和提高算法鲁棒性。
-
-
-