-
公开(公告)号:CN111598108A
公开(公告)日:2020-08-28
申请号:CN202010319916.9
申请日:2020-04-22
Applicant: 南开大学
Abstract: 一种基于立体注意力控制的多尺度神经网络的快速显著性物体检测方法。该方法的目的是设计一个用于显著性物体检测的轻量级卷积神经网络。该方法通过一个多分支的结构来提取多尺度的卷积特征,每个分支是具有不同膨胀率的深度可分离卷积;将所有分支的卷积特征相加,用一个立体注意力单元来为每个分支计算注意力图;然后将计算得到的注意力图和每个分支的特征分别相乘,把各个分支相乘后的结果相加,并加上残差连接,构成一个立体注意力控制的多尺度卷积模块;最后,将该多尺度模块堆叠起来,构成深度卷积神经网络,对自然图像进行显著性物体检测。实验表明,相对于已有的方法,本发明方法的速度更快、参数更少、计算量更少并且精度相似。
-
公开(公告)号:CN110135462A
公开(公告)日:2019-08-16
申请号:CN201910311265.6
申请日:2019-04-18
Applicant: 南开大学
Abstract: 本发明公开了一种基于上下文信息的艺术画风格分类方法,属于计算机视觉技术领域。该方法的目的是从艺术史中找到影响艺术画风格发展的信息,利用这些信息生成标签分布并用于训练卷积神经网络,即将艺术画的上下文信息以标签分布的形式作为卷积神经网络的输入来辅助图像训练,从而解决艺术画风格分类的问题。在艺术画分类任务中,大多数方法都仅仅利用图像特征进行分类,而忽视了艺术画在定义风格时往往会考虑它创作时所处上下文背景的现象。针对这一问题,通过本发明的标签分布生成方法将艺术画的上下文信息转化为标签分布,并将其作为卷积神经网络的输入标签,而后同时优化分类损失函数和标签分布损失函数,最终应用于艺术画风格分类的任务中。
-
公开(公告)号:CN110110780A
公开(公告)日:2019-08-09
申请号:CN201910358002.0
申请日:2019-04-30
Applicant: 南开大学
IPC: G06K9/62
Abstract: 一种基于对抗神经网络和海量噪声数据的图片分类方法,解决使用深度学习进行图片分类任务时数据不足的问题。该方法将网络图像与标准数据集中的图像同时作为训练数据送入卷积神经网络中,并使用类别标签和来源标签分别表示图像内容上的类别及数据来源;分别计算标签预测损失和来源识别损失得到联合损失,通过最小化联合损失,使网络数据和标准数据的表现趋向于一致。该方法可用于计算机视觉的各种细分类任务中,大量网络数据作为训练数据可以有效地提升卷积神经网络的分类性能。本方法在训练过程中采用对抗策略使得模型对于数据的来源变得不敏感、网络数据与标准数据能够很好地混合在一起。
-
公开(公告)号:CN109285114A
公开(公告)日:2019-01-29
申请号:CN201710602208.4
申请日:2017-07-21
Abstract: 本发明实施例公开了一种图片处理方法及设备,涉及图像处理领域,解决了图像处理模型对待处理图片进行图像处理过程中,图片整体布局被破坏、前景背景不分明的问题。具体方案为:获取待处理图片;根据图像处理模型对待处理图片进行图像处理;其中,图像处理模型由对一个正样本图片和至少两个负样本图片根据损失函数进行训练获得,损失函数的输入参数包括深度损失,深度损失用于表征经过图像处理的图片的深度信息的变化。本发明实施例用于图像风格变换处理或图像超分辨率重建处理的过程。
-
公开(公告)号:CN108416382A
公开(公告)日:2018-08-17
申请号:CN201810171017.1
申请日:2018-03-01
Applicant: 南开大学
Abstract: 本发明公开了一种基于迭代采样和一对多标签修正的Web图像训练卷积神经网络方法。该方法的目的是通过在训练集中逐步地加入Web图像来解决使用深度学进行计算机视觉任务时数据不足的问题。这种新的方法可以作为计算机视觉各种任务的辅助处理步骤,其关键在于随着模型的训练,更新的模型将能更准确地对Web图像的标签置信度进行预测,然后通过对比把高质量的数据加入到训练数据中继续提升模型的性能,最终可以有效地减少Web数据中的噪声数据并提升卷积神经网络的性能。同时考虑到Web图像内容的复杂性和多样性,本方法在迭代过程采用了一对多的标签修正策略来减少硬标注对模型训练带来的影响。基于以上的步骤,整个模型迭代训练直到网络的性能趋于稳定。
-
公开(公告)号:CN108388903A
公开(公告)日:2018-08-10
申请号:CN201810171247.8
申请日:2018-03-01
Applicant: 南开大学
Abstract: 本发明公开了一种基于多视角多特征的图像印象性预测方法,属于图像处理技术领域。图像印象性是一种特殊的图像属性。对印象性的预测是为了能够在短时间内判断出更符合人类预期的图片作品进行推荐,降低筛选过程的时间消耗。该方法的设计参考了经典的图像属性分析结构,基于心理学理论基础和视觉图像分析,总结出六点主要线索,结合多层次的视觉特征对各个主要线索进行建模,最终达到预测印象性的目的。使用该方法对图像印象性进行检测,可以更好地模拟人类感知,用来进行更多高级的视觉任务。
-
公开(公告)号:CN119809935A
公开(公告)日:2025-04-11
申请号:CN202411993914.2
申请日:2024-12-31
Applicant: 南开大学
IPC: G06T3/4053 , G06T3/4046 , G06N3/0455 , G06N3/084
Abstract: 本发明属于图像超分辨率领域,提供了一种基于均值转移扩散的真实场景图像超分辨率方法及系统,获取真实场景中的低分辨图像,利用预训练的变分自编码器将低分辨率图像投影在潜在空间得到低分辨率图像潜在特征;向低分辨率图像潜在特征中加入噪声,得到起始扩散状态;基于起始扩散状态,迭代利用预训练稳定扩散模型进行去噪,并以低分辨率图像潜在特征作为控制信号指导每一轮迭代,得到超分辨率重构图像。本发明提出了一种均值迁移的扩散过程实现训练与测试的一致。基于所提出的均值迁移扩散过程,本发明设计了对应的训练策略和推理方法,并使用该训练策略微调了现有稳定扩散模型。
-
公开(公告)号:CN118628408A
公开(公告)日:2024-09-10
申请号:CN202410610768.4
申请日:2024-05-16
Applicant: 南开大学
IPC: G06T5/77 , G06T5/60 , G06N3/0464 , G06N3/08
Abstract: 本发明公开了一种基于图像掩码建模的一体化图像修复方法及系统,其中方法,包括:将第一训练集输入到图像修复网络中,对图像修复网络进行训练,得到预训练的图像修复网络;对预训练的图像修复网络,计算每个网络层的重要性,筛选出重要性排序靠前的k个网络层;将第二训练集输入到预训练的图像修复网络中,对预训练的图像修复网络进行训练;其中,在对预训练的图像修复网络进行训练的过程中,对非前k的网络层的网络参数固定不变,只对排序前k的网络层的网络参数进行优化,得到最终训练后的图像修复网络;获取待修复的图像,将待修复图像输入到最终训练后的图像修复网络中,得到修复后的图像。
-
公开(公告)号:CN117251589A
公开(公告)日:2023-12-19
申请号:CN202310935657.6
申请日:2023-07-27
Applicant: 南开大学
Abstract: 本公开提供了基于文生图扩散模型的图像生成内容抑制方法及系统,涉及图像生成技术领域,包括将文本输入目标提示词映射为文本嵌入;将文本嵌入分为期望被抑制的嵌入以及鼓励保留的嵌入两个部分,构造目标文本嵌入矩阵,对所述目标文本嵌入矩阵进行奇异值分解,提取被抑制的语义信息;为每个奇异值引入软加权正则化,还原目标文本嵌入矩阵;将目标文本嵌入矩阵输入至扩散模型中,通过交叉注意力输出对应的期望被抑制特征注意图以及鼓励保留特征注意图,提出两个注意力损失评估注意力图;引入对齐损失和多样性损失,抑制期望被抑制的主体的生成,最后生成移除期望被抑制实体后的图像。本公开提高SD模型生成预期主体并抑制不需要的主体的能力。
-
公开(公告)号:CN116740348A
公开(公告)日:2023-09-12
申请号:CN202310626321.1
申请日:2023-05-30
Applicant: 南开大学
IPC: G06V10/26 , G06V10/77 , G06V10/80 , G06V10/774 , G06V10/82
Abstract: 本发明提出了一种指向性伪装物体分割方法及系统,设计了双分支网络结构,利用参考分支网络获取来参考图像中某类指向性物体的共性信息,分割分支网络则在所得到的共性信息指导下确认并分割包含该指向性伪装物体的目标图像。通过将共性信息和目标图像的视觉特征进行交互融合的方式突出目标图像中的指向性伪装物体。本发明方法受其他物体的干扰较小,进而能够更加准确地分割出期望的物体,而且利用参考图像的共性信息来突出目标图像中的指向性伪装物体的方式,适合小样本所收集的参考信息对某类物体进行指向性的分割。
-
-
-
-
-
-
-
-
-