基于前景背景多级划分与特征融合的细粒度图像分类方法

    公开(公告)号:CN118262180B

    公开(公告)日:2025-01-03

    申请号:CN202410549161.X

    申请日:2024-05-06

    Abstract: 本发明涉及一种基于前景背景多级划分与特征融合的细粒度图像分类方法,该方法利用主干网络得到检测图像中不同区域的重要程度分布,并通过设定阈值对图像进行分割,得到前景图像和多级背景图像;对分割后的图像进行预处理并输入主干网络,得到前景特征和多个背景特征;基于每一个背景特征和前景特征之间的相似度,以及每一个背景特征的原图像与前景图像的距离得到两组权重,对前景特征和每一个背景特征进行两次加权,将加权后的所有特征进行融合并送入分类器得到分类结果。本发明采用前景‑背景多级划分和特征加权融合,使分类模型能够更加准确地捕获图像中强判别区域的同时,提取了图像背景中的有效信息并去除噪音,有效提高了分类准确性。

    基于前景背景多级划分与特征融合的细粒度图像分类方法

    公开(公告)号:CN118262180A

    公开(公告)日:2024-06-28

    申请号:CN202410549161.X

    申请日:2024-05-06

    Abstract: 本发明涉及一种基于前景背景多级划分与特征融合的细粒度图像分类方法,该方法利用主干网络得到检测图像中不同区域的重要程度分布,并通过设定阈值对图像进行分割,得到前景图像和多级背景图像;对分割后的图像进行预处理并输入主干网络,得到前景特征和多个背景特征;基于每一个背景特征和前景特征之间的相似度,以及每一个背景特征的原图像与前景图像的距离得到两组权重,对前景特征和每一个背景特征进行两次加权,将加权后的所有特征进行融合并送入分类器得到分类结果。本发明采用前景‑背景多级划分和特征加权融合,使分类模型能够更加准确地捕获图像中强判别区域的同时,提取了图像背景中的有效信息并去除噪音,有效提高了分类准确性。

    一种基于背景语义生成和方位部件替换的图像扩增方法

    公开(公告)号:CN119693725A

    公开(公告)日:2025-03-25

    申请号:CN202510210936.5

    申请日:2025-02-25

    Abstract: 本发明公开了一种基于背景语义生成和方位部件替换的图像扩增方法,包括:利用视觉语言模型收集原始图像数据集中每个原始样本的背景信息,并为每个原始样本添加方向标签;通过扩散模型生成保持原始样本的前景不变、背景受背景信息语义控制的多个新生样本;基于部件分割技术对原始样本和新生样本的前景进行部件分割,根据方向标签将新生样本中前景的部件替换为同类别的原始样本中前景的相应部件,得到扩增样本数据集。本发明在保持前景不变的前提下,实现了语义控制的背景生成,结合方向语义与部件级别分割技术,实现细粒度的目标部件替换,使图像混合后结构合理。本发明既能增强样本多样性,又能保持高类别保真度,可极大地提高模型的泛化能力。

    一种基于可控背景混合的图像扩增方法及系统

    公开(公告)号:CN119152312B

    公开(公告)日:2025-02-28

    申请号:CN202411597255.0

    申请日:2024-11-11

    Abstract: 本发明公开了一种基于可控背景混合的图像扩增方法及系统,该方法包括:基于视觉语言大模型获取原始图像数据集中每个图像的前景对象及背景信息的描述文本,得到多模态数据集;利用大语言模型根据多模态数据集对前景对象进行分类、对背景信息进行关键词提取,得到每个类别的前景对象对应的背景关键词;对每类前景对象的背景关键词进行均衡性分析,确定背景均衡方案;基于背景均衡方案生成扩增图像,将所述扩增图像添加到所述原始图像数据集中补充每类前景对象缺少的背景信息,得到背景均衡的扩展数据集。本发明能够充分利用背景的上下文信息,通过处理图像背景完成数据扩增,实现数据集的标签零污染,帮助提高模型的泛化能力。

    一种基于数据平衡的交叉验证数据集裁剪和评估方法

    公开(公告)号:CN118279696A

    公开(公告)日:2024-07-02

    申请号:CN202410367109.2

    申请日:2024-03-28

    Abstract: 本发明公开了一种基于数据平衡的交叉验证数据集裁剪和评估方法,该方法首先对样本数据集进行划分,采用k折交叉验证法对预设第一图像分类模型进行训练,记录以每个子集作为验证集时每个样本的预测准确性和预测概率值;基于预测准确性和预测概率值对样本进行排序,根据排序结果对样本进行删除,得到核心数据集;利用核心数据集对预设第二图像分类模型进行训练,得到训练完备的预设第二图像分类模型;最后通过测试数据集对训练完备的预设第二图像分类模型进行性能评估。本发明既实现了保留信息丰富的不确定性样本,又保证了样本评估不会因为图像分类模型记忆而产生误差,改善深度学习图像分类模型的效率和泛化能力。

    一种基于可控背景混合的图像扩增方法及系统

    公开(公告)号:CN119152312A

    公开(公告)日:2024-12-17

    申请号:CN202411597255.0

    申请日:2024-11-11

    Abstract: 本发明公开了一种基于可控背景混合的图像扩增方法及系统,该方法包括:基于视觉语言大模型获取原始图像数据集中每个图像的前景对象及背景信息的描述文本,得到多模态数据集;利用大语言模型根据多模态数据集对前景对象进行分类、对背景信息进行关键词提取,得到每个类别的前景对象对应的背景关键词;对每类前景对象的背景关键词进行均衡性分析,确定背景均衡方案;基于背景均衡方案生成扩增图像,将所述扩增图像添加到所述原始图像数据集中补充每类前景对象缺少的背景信息,得到背景均衡的扩展数据集。本发明能够充分利用背景的上下文信息,通过处理图像背景完成数据扩增,实现数据集的标签零污染,帮助提高模型的泛化能力。

Patent Agency Ranking