-
公开(公告)号:CN118411522A
公开(公告)日:2024-07-30
申请号:CN202410507107.9
申请日:2024-04-25
Applicant: 南京邮电大学
IPC: G06V10/26 , G06V10/764 , G06V10/774 , G06V10/82 , G06N3/0455 , G06N3/0895
Abstract: 本发明公开了一种结合上下文注意力的Transformer弱监督语义分割方法,本发明属于图像处理分割技术领域,包括如下步骤:步骤一、选取有弱标签的语义分割图像数据集;步骤二、构建结合上下文注意力的Transformer弱监督语义分割网络模型,构建的网络模型包括Transformer编码器、解码器、伪标签细化模块和上下文注意力模块;步骤三、设置适用于所述网络模型的损失函数;步骤四、使用图像数据集训练网络模型,获得最终训练好的弱监督语义分割网络模型;步骤五、将待分割的图像输入到训练好模型参数的网络模型中,输出天图像的分割结果图。
-
公开(公告)号:CN113421268B
公开(公告)日:2022-09-16
申请号:CN202110637809.5
申请日:2021-06-08
Applicant: 南京邮电大学
Abstract: 本发明公开了一种基于多层级通道注意力机制deeplabv3+网络的语义分割方法,属于图像处理分割技术领域,包括如下步骤:步骤1:输入图像;步骤2:通过深度卷积神经网络获取输入图像的高级与低级语义特征;步骤3:将高级语义特征发送至空洞金字塔池化模块,步骤4:将步骤3获取的第一特征图送入多层级通道注意力机制模块,步骤5:将步骤4获取的第二特征图进行双线性插值上采样并与步骤2中获得的低级语义特征合并,步骤6:将步骤5中的合并特征图再次进行双线性插值上采样;步骤7:输出最终的预测结果;本发明在提高表语义分割的准确率的同时,减小网络模型的大小,提高识别速度,以满足移动应用的实时性要求。
-
公开(公告)号:CN104166962A
公开(公告)日:2014-11-26
申请号:CN201410365880.2
申请日:2014-07-29
Applicant: 南京邮电大学
Abstract: 本发明公开了一种使用散射核方法的锥束CT散射校正方法,其步骤为:步骤一:测量遮挡板下的散射信号;步骤二:自适应散射核参数的计算;步骤三:估计扩散函数的参数;步骤四:通过扩散函数对图像进行散射校正;步骤五:图像遮挡区域的修复;步骤六:锥束CT的重建。本发明不需要获取模型参数的先验数据,不增加图像获取及重建的复杂度,添加的设备复杂度不高,且不需要重复扫描被测物体,能高效的进行锥束CT散射校正。
-
公开(公告)号:CN104036473A
公开(公告)日:2014-09-10
申请号:CN201410239703.X
申请日:2014-05-30
Applicant: 南京邮电大学
Abstract: 本发明属于数字图像处理领域,提供了一种基于分裂Bregman迭代的快速鲁棒图像运动去模糊方法,通过直接利用图像梯度与运动模糊核的L0范数并结合其各自的L2范数,构建运动模糊核估计的非凸非光滑能量泛函;通过耦合算子分裂和增广拉格朗日方法,设计运动模糊核的分裂Bregman迭代求解格式;利用基于全变差先验的图像非盲去模糊方法,实现图像的快速去模糊。本发明通过引入支撑连续性先验,提高了运动模糊核的估计精度;设计了一种新的基于分裂Bregman迭代的快速解法,大幅提高了运动模糊核的估计效率。
-
公开(公告)号:CN115496650A
公开(公告)日:2022-12-20
申请号:CN202211029533.3
申请日:2022-08-25
Applicant: 南京邮电大学
Abstract: 本发明提出一种基于生成对抗网络的妆容迁移方法,该方法包括(1)针对数据集划分一定数量的图像作为训练集和测试集,对每张图像进行裁剪与归一化等预处理;(2)妆容图像经过面部风格生成器得到特征分量,分量送入两个用于特征提取的卷积层,妆容图像的样式代码和素颜图像特征图输入特征图输入到融合块,输出的参数经过面部图像编码器编码送入到自注意力中进行信息融合,经过Resblock模块得到带有妆容图像化妆风格的人脸图像;(3)判别器区分真实的化妆图像和生成图像之间的区别,生成器通过步骤(2)中的输入素颜图像和妆容图像生成带有妆容图像风格的图像;(4)通过改变编码控制原始图像的轮廓权重和妆容图像的内容权重以得到最终的图像。
-
公开(公告)号:CN108537733B
公开(公告)日:2022-03-11
申请号:CN201810325131.5
申请日:2018-04-11
Applicant: 南京邮电大学
Abstract: 本发明公开了一种基于多路径深度卷积神经网络的超分辨率重建方法,包括如下步骤:获得总训练集、总训练集图像预处理、测试集准备和用卷积神经网络的卷积层实现图像重建;本发明提出的多路径卷积神经网络结构,在原有的单路径神经网络基础上增加了多条支路,能够对不同尺度的图像特征用不同数量的卷积核处理,不增加总体参数量的同时在重建质量和视觉效果上较原先的方法均有提升。
-
公开(公告)号:CN113723231A
公开(公告)日:2021-11-30
申请号:CN202110940177.X
申请日:2021-08-17
Applicant: 南京邮电大学
Abstract: 本发明公开了低光照语义分割模型训练方法、语义分割方法及装置,所述低光照语义分割模型的训练方法,所述方法包括:获取低光照下图像数据集;通过图像增强模型,分别对获取的图像数据进行增强处理,获得增强图像数据集和增强图像损失函数;通过语义分割模型,分别对获取的增强图像数据进行语义分割,获得语义分割图像数据集和语义分割损失函数;根据增强图像损失函数与语义分割损失函数,获得总损失函数;根据总损失函数对所述语义分割模型进行调整,获得低光照语义分割模型。本发明用于在低光照场景下获得精确的分割精度。
-
公开(公告)号:CN105931191B
公开(公告)日:2019-05-03
申请号:CN201510964588.7
申请日:2015-12-21
IPC: G06T5/00
Abstract: 本发明公开了基于凹凸混合正则先验的图像盲去卷积方法,该方法是一种针对相机摄像头的散焦、抖动等原因造成的图像模糊进行去卷积的方法。主要分三步执行,即:输入降质的模糊图像,求解图像的凹凸混合广义全变差最小化泛函,迭代估计中间清晰图像。利用给定的模糊核尺寸以及上述清晰图像的梯度信息,求解模糊核的凹凸混合弹性网正则化最小化泛函,迭代估计中间模糊核。利用上述两步骤交替迭代结束后的最终模糊核以及倒基尼系数稀疏正则的图像非盲去卷积方法,迭代估计最终去卷积图像。
-
公开(公告)号:CN108491858A
公开(公告)日:2018-09-04
申请号:CN201810141576.8
申请日:2018-02-11
Applicant: 南京邮电大学
Abstract: 本发明公开了一种基于卷积神经网络的疲劳驾驶检测方法及系统,属于图像处理与模式识别技术领域。首先,采集驾驶员在驾驶状态下的二维面部图像,并按疲劳程度逐级分类,建立疲劳驾驶图像库;其次,构建一个含有数据层、卷积层、池化层、连接层和分类层的卷积神经网络;然后,以疲劳驾驶图像库中图像数据和标签作为卷积神经网络的输入,利用反向传播算法对构建的网络迭代训练,使网络输出损失函数值逐步下降并收敛;最后,输入驾驶员驾驶状态下面部图像测试样本,利用训练后的卷积神经网络模型对其识别,实现驾驶员面部图像疲劳程度的检测分类。本发明相比于传统机器学习方法,明显提高了识别分类效果,为疲劳驾驶实时监测提供一种可行思路。
-
公开(公告)号:CN104036473B
公开(公告)日:2018-01-05
申请号:CN201410239703.X
申请日:2014-05-30
Applicant: 南京邮电大学
Abstract: 本发明属于数字图像处理领域,提供了一种基于分裂Bregman迭代的快速鲁棒图像运动去模糊方法,通过直接利用图像梯度与运动模糊核的L0范数并结合其各自的L2范数,构建运动模糊核估计的非凸非光滑能量泛函;通过耦合算子分裂和增广拉格朗日方法,设计运动模糊核的分裂Bregman迭代求解格式;利用基于全变差先验的图像非盲去模糊方法,实现图像的快速去模糊。本发明通过引入支撑连续性先验,提高了运动模糊核的估计精度;设计了一种新的基于分裂Bregman迭代的快速解法,大幅提高了运动模糊核的估计效率。
-
-
-
-
-
-
-
-
-