-
公开(公告)号:CN116612083A
公开(公告)日:2023-08-18
申请号:CN202310567190.4
申请日:2023-05-19
Applicant: 南京邮电大学
IPC: G06T7/00 , G06V10/44 , G06V10/82 , G06V10/80 , G06N3/0464 , G06N3/0499 , G06N3/045 , G06N3/0475
Abstract: 本发明公开了一种结合Transformer和卷积网络的无参考图像质量评价方法,包括:对失真图像进行下采样和位置编码得到特征序列,输入到基于Transformer的生成网络中获取失真图像的多层特征;失真图像第三层特征通过线性逆平摊得到伪参考图像;将失真图像的多层特征分别通过卷积和归一化操作进行特征变换后加权相加得到失真图像的全局特征;将失真图像和伪参考图像输入到卷积神经网络中分别提取卷积特征,并进行连接得到失真图像的局部特征;将失真图像的全局特征和局部特征进行连接得到融合特征,输入到线性回归网络中得到失真图像的质量评价结果。结合了失真图像基于Transformer的全局特征和失真图像与伪参考图像的局部卷积特征,具有更好的质量预测准确性。
-
公开(公告)号:CN108830800B
公开(公告)日:2023-02-28
申请号:CN201810438478.0
申请日:2018-05-09
Applicant: 南京邮电大学
Abstract: 本发明公开了一种暗光场景下图像的亮度提升增强方法,包括读入低照度RGB彩色图像I;提取图像I在HSV颜色空间中的明度分量V,并根据明度分量V将低照度图像I分割为暗区域和亮区域;根据低照度RGB彩色图像I在HSV颜色空间中的明度分量V对图像进行标识;根据标识结果采用特定方法求取针对暗区域Ω1和亮区域Ωh的最佳增强系数λ1和λh;根据最佳增强参数λ1和λh分别对低照度RGB彩色图像I进行增强,得到对应的增强图像Ml和Mh,进行融合得到融合图像M;对增强图像M进行自适应光照补偿得到最终的增强图像h。本发明中的暗光场景下图像的亮度提升增强方法处理速度快、步骤简单,在增强暗光区域亮度和对比度的同时能增强亮区域的对比度,增强效果自然,颜色失真和噪声较小。
-
公开(公告)号:CN109862354B
公开(公告)日:2023-02-10
申请号:CN201910119549.5
申请日:2019-02-18
Applicant: 南京邮电大学
IPC: H04N19/103 , H04N19/122 , H04N19/177 , H04N19/96
Abstract: 本发明公开了一种基于残差分布的HEVC快速帧间深度划分方法,在低延时或随机接入编码配置下读入编码帧,执行Inter_2N×2N模式后以4×4像素块为单位计算编码单元内不同块的残差值;对4×4像素块的残差取平均作为所处深度CU的残差均值;在执行统计残差的帧中,每编码完成一个编码树单元,根据CTU的实际深度,将预测过程中相应深度的CU残差分为分割和不分割两类,根据统计认为残差均值服从高斯分布;在基于残差进行快速深度决策的帧中,以各深度Inter_2N×2N模式完成后的残差均值为特征,计算残差在高斯分布中的概率并根据概率大小确定当前CU是否分割;依次编码剩余CTU和后续帧,直到全部帧编码完成。该方法在较好保持视频编码质量的同时能较大幅度地降低HEVC帧间预测的计算复杂度。
-
公开(公告)号:CN109886265B
公开(公告)日:2022-08-16
申请号:CN201910027016.4
申请日:2019-01-11
Applicant: 南京邮电大学
IPC: G06V20/62 , G06V30/146 , G06V30/18 , G06V30/19 , G06K9/62
Abstract: 本发明提供了一种基于Adaboost和模板匹配的车门限位器检测方法,包括利用Adaboost分类器对待测车门限位器的图片中的螺母特征进行识别与定位;根据待测车门限位器的图片中螺母特征的定位结果以及待测车门限位器的图片的上螺母与字符特征之间的位置关系,初步对待测车门限位器图片上的字符区域进行粗定位;利用双重迭代法制作字符的最佳模板库,同时求得模板匹配的最佳阈值;提取待测车门限位器图片和模板的边缘特征,利用改进的快速模板匹配方法识别这些字符,完成待测车门限位器检测与识别的几个步骤;提升了车门限位器检测的检测速度和正确率。
-
公开(公告)号:CN111243230B
公开(公告)日:2022-05-06
申请号:CN202010071307.6
申请日:2020-01-20
Applicant: 南京邮电大学
Abstract: 本发明公开了一种基于两台深度相机的人体跌倒检测装置和方法,包括第一深度相机,还包括第二深度相机,所述第一深度相机距离地面一定高度,垂直于竖直墙面放置,朝向门,第二深度相机移动设置在天花板上的直线导轨上,第一深度相机、第二深度相机采集的图像发送给图像处理器,所述图像处理器运行基于两台深度相机的人体跌倒检测方法。本发明只对登记的用户进行追踪和跌倒检测,减少了无意义的计算。第二深度相机能够有效捕捉到被遮挡的目标,防止由于目标跌倒时被遮挡而导致的漏检,特别适合在复杂遮挡情况下的人体跌倒检测。
-
公开(公告)号:CN107423501B
公开(公告)日:2020-05-19
申请号:CN201710581686.1
申请日:2017-07-17
Applicant: 南京邮电大学
Abstract: 本发明公开了一种基于光伏电站逻辑图的阵列自动检测和编号方法,该方法首先将光伏电站总逻辑图进行分区得到分区图像,去除分区图像的彩色信息得到灰度图,对灰度图进行二值化阈值分割得到分离背景和前景(即阵列轮廓)的二值图像,然后提取二值图像的矩形轮廓,并通过计算矩形轮廓的众数信息排除假轮廓和噪声干扰,提取准确的阵列矩形,最后对每一个阵列进行行列编号,并计算阵列四个顶点的大地坐标,再转化为GPS坐标,将行列编号和GPS坐标信息保存到数据文件中。本发明能够为无人机拍摄光伏电站红外图像进行巡航时的自动路线规划以及热斑检测与定位等应用提供阵列的位置和编号信息,为提高光伏电站故障检测的自动化水平提供技术支撑。
-
公开(公告)号:CN110852962A
公开(公告)日:2020-02-28
申请号:CN201911035976.1
申请日:2019-10-29
Applicant: 南京邮电大学
Abstract: 本发明提供了一种基于回归树分类的双重映射学习压缩人脸图像复原方法。在训练阶段,首先将得到的残差人脸图像不重叠分块,对应位置压缩图像块向外扩展后分块构成训练样本集;再对每个压缩图像块进行二次重叠分块,对得到的每个子块进行多维特征提取再进行回归树分类;通过分类结果引导压缩图像块进行全局回归和多局部线性回归的双重映射;得到的双重映射作为压缩图像块和残差图像块之间的非线性回归模型;将上述模型应用到待清晰的图像块中,得到复原后的残差图像块;按照位置顺序将残差图像块无重叠拼接后再加上压缩图像,得到最终复原后的清晰人脸图像。
-
公开(公告)号:CN110458812A
公开(公告)日:2019-11-15
申请号:CN201910663730.2
申请日:2019-07-22
Applicant: 南京邮电大学
Abstract: 本发明公开了一种基于颜色描述及稀疏表达的类圆形水果缺陷检测方法。所述方法包括如下步骤:获取待检测图像的远邻域颜色描述特征;对所述远邻域颜色描述特征进行修正获取修正后的远邻域颜色描述特征;根据所述修正后的远邻域颜色描述特征建立高斯混合模型;根据所述高斯混合模型获取待检测水果的缺陷位置。该方法以图像块为基础,通过考虑图像块与远邻域区域的差异性、与邻域区域的相似性及图像块自身颜色的数量、空间分布情况完成检测。本发明方法属于无监督学习方法,以分类方式输出检测结果,可完成多类型、多数量类圆形水果缺陷检测任务。
-
公开(公告)号:CN110354480A
公开(公告)日:2019-10-22
申请号:CN201910683497.4
申请日:2019-07-26
Applicant: 南京邮电大学
Abstract: 本发明公开了一种基于姿态比对的高尔夫挥杆动作评分估计方法,包括:模板视频和用户视频进行配准;提取用户视频人体动作特征;将提取的用户视频人体特征及其模板视频挥杆动作比对,并对不同特征的比对结果进行加权评分。本发明提供的基于姿态比对的高尔夫挥杆动作评分估计方法,无论是在背景简单还是杂场景中都能快速准确的计算出高尔夫挥杆动作的评分,具有很好的推广前景。
-
公开(公告)号:CN107483931B
公开(公告)日:2019-10-08
申请号:CN201710646984.4
申请日:2017-08-01
Applicant: 南京邮电大学
IPC: H04N19/11 , H04N19/14 , H04N19/147 , H04N19/182 , H04N19/593
Abstract: 本发明公开了一种基于显著度的HEVC帧内编码深度划分快速决策方法,首先读入当前编码帧以及当前帧以像素为单位的显著度值,计算当前帧不重叠的以4×4像素块为单位的显著度值,再计算当前帧所有的最大编码单元(LCU)的显著度值并归一化,然后根据比例将当前帧按LCU层归一化后的显著度值划分为低显著度、中显著度和高显著度三个区域,并根据LCU所属的显著度区域为其设置HEVC帧内编码时不同的深度划分范围,最后对当前帧中每一个LCU按照设置的深度范围进行HEVC帧内编码,选择率失真代价最小的深度为最优的帧内编码深度。本发明通过显著度信息来缩小HEVC帧内编码时LCU的最优深度查找范围,能够有效减小HEVC帧内编码的计算复杂度和编码时间,且编码效率的损失很小。
-
-
-
-
-
-
-
-
-