-
公开(公告)号:CN110287802A
公开(公告)日:2019-09-27
申请号:CN201910456761.0
申请日:2019-05-29
Applicant: 南京邮电大学
Abstract: 本发明公开了图像处理中的人眼凝视点预测技术领域的一种基于优化图像前景和背景种子的人眼凝视点预测方法,旨在解决现有技术中前景种子或背景种子容易被误分类且对比度与相关性利用不合理的技术问题,本发明所述方法包括以下步骤:对输入图像进行超像素分割;对超像素块,计算空间位置加权的颜色对比度,得到以超像素块为单位的初步显著图;构建7维特征,并计算各类的显著度均值;进行流形排序得到基于优化前景的显著图和基于优化背景的显著图;进行非线性融合,并通过阈值化得到人眼凝视点位置。本发明利用优选的前景和背景种子得到显著图,并通过非线性融合得到最终显著图和人眼凝视点位置,得到的结果更加准确。
-
公开(公告)号:CN109308685A
公开(公告)日:2019-02-05
申请号:CN201810901955.2
申请日:2018-08-09
Applicant: 南京邮电大学
Abstract: 本发明公开了一种基于阈值分割和K均值聚类的红外光伏阵列分割方法,首先利用梯度特性和温度特性对输入的红外光伏阵列图像进行预处理以初步去除背景区域和阴影区域;之后基于单高斯模型对预处理后的红外图像进行前景建模并进行自适应阈值分割,得到初步的光伏阵列分割结果;最后利用K均值聚类进行区域相似性度量以进一步精炼阵列分割结果。本发明通过利用自适应阈值分割和K均值聚类相结合的方法进行红外图像阵列识别,提高了背景区域干扰严重时的红外光伏阵列图像分割结果。
-
公开(公告)号:CN109300165A
公开(公告)日:2019-02-01
申请号:CN201811074019.5
申请日:2018-09-14
Applicant: 南京邮电大学
Abstract: 本发明公开了一种基于像素特征的新型目标追踪定位方法,包括:人体区域消除:对图像像素点的RGB分量进行三帧差法提取前景,并对前景图像进行二值化处理得到二值图像;检测二值图像中的人体关键点,包括手部关键点、眉心关键点和双足中点;标记二值图像的所有连通区域;目标追踪定位:根据连通区域的像素分布特性来确定目标位置及目标定位点;运动特征修正:根据检测出连通区域中的像素点分布特性对目标使用降维方法来求取区域的矢量方向并进行目标点位置修正。本发明方法可以快速的提取运动特征,无论是在背景简单还是复杂场景中都能快速准确的追踪定位到运动目标,尤其是运动时间短、目标细长的目标时,极具实用性,具有很好地推广前景。
-
公开(公告)号:CN107729812A
公开(公告)日:2018-02-23
申请号:CN201710842192.4
申请日:2017-09-18
Applicant: 南京邮电大学
CPC classification number: G06K9/00771 , G06K9/4652 , G06K9/6269
Abstract: 本发明提供了一种适用于监控场景中的车辆颜色识别方法,其主要包含了基于颜色相似性聚类的分割方法、词袋模型与HSV空间相结合形成车辆颜色特征向量的方法。首先对车辆图片进行尺寸归一化处理,利用边缘检测的方法消除玻璃窗对车身颜色特征提取的干扰,然后利用颜色相似性聚类的方法将车身部分分成多个颜色信息相差较大的像素块,对像素块中的像素个数进行归一化得到该像素块的第一个权重,利用基于欧式距离的模型为该像素块分配第二个权重。抽取各种颜色的车辆图片,利用k-means聚类的方法生成一个特征表作为码本,利用词袋模型得出每一幅图片的颜色特征向量。最后利用分类器将该车辆的颜色分类出来。本发明具有准确率高、鲁棒性好、实用性高的优点。
-
公开(公告)号:CN105488759A
公开(公告)日:2016-04-13
申请号:CN201510902909.0
申请日:2015-12-09
Applicant: 南京邮电大学
IPC: G06T3/40
CPC classification number: G06T3/4053
Abstract: 本发明公开一种基于局部回归模型的图像超分辨率重建方法,首先,对输入低分辨率图像,高斯低通滤波得到其低频带图像,双立方插值得到输出高分辨率图像的近似低频带图像。其次,重建时对高分辨率图像的低频带图像中每个图像块应用一阶回归模型,回归模型中高/低图像间的映射函数可对输入图像通过机器学习的方法得到,即利用输入低分辨率图像及其低频带图像对应位置采样得到对应位样本图像块对进行字典训练。最后,重建图像块的非局部自相似块分别应用一阶回归模型,加权综合得到重建的高分辨率图像块。本发明所提出方法无需利用外部图像模型,而是利用输入图像自身学习得到先验模型,依此模型重建出的高分辨图像取得了较好的主客观重建效果。
-
公开(公告)号:CN103079073A
公开(公告)日:2013-05-01
申请号:CN201310015778.5
申请日:2013-01-16
Applicant: 南京邮电大学
IPC: H04N7/26 , H04N21/2385 , H04L27/26
Abstract: 本发明是一种正交频分多址接入系统中面向可伸缩视频的资源分配方法,根据可伸缩视频业务的特点,在正交频分多址接入系统中进行跨层资源分配,属于跨层优化资源分配技术领域。本发明主要包括三个方面的内容:一是建立正交频分多址接入系统资源分配模型;二是提出一种新的正交频分多址接入系统通话接入控制算法,可以根据信道条件选择调制方式;三是针对可伸缩视频业务提出一种跨层优化的资源分配算法,可以根据各个用户的信道条件来对用户进行自适应的子载波分配和功率分配,从而增加系统支持的用户数并提供更好的服务质量。
-
公开(公告)号:CN101964913A
公开(公告)日:2011-02-02
申请号:CN201010266382.4
申请日:2010-08-27
Applicant: 南京邮电大学
IPC: H04N7/68
Abstract: 本发明是一种基于模糊分类的帧间误码掩盖方法,属于基于宏块编码的视频通信技术领域。本发明主要包含三个内容:一是建立已解码帧的缓存区,并对已解码帧进行模糊特征值提取,并通过已经训练好的模糊分类器进行分类;二是利用已解码帧缓存区中的模糊分类器判决为可用的所有已解码帧对当前解码帧的丢失宏块进行帧间误码掩盖;三是对有所的可用重建帧对当前误码帧进行误码掩盖后的数据进行拟合,得到最终的误码掩盖的结果。
-
公开(公告)号:CN101699469A
公开(公告)日:2010-04-28
申请号:CN200910185427.2
申请日:2009-11-09
Applicant: 南京邮电大学
Abstract: 课堂录像中教师黑板书写行为的自动识别方法,属于远程教育系统中的图像识别技术,其处理步骤为:a.使用采集卡采集一帧图像,用当前帧与前一帧做图像相减运算,得到二值化的帧差图像并进行分析;b.对二值帧差图像做数学形态学中的闭运算处理之后,再进行连通区域标记,通过设置阈值,去除二值帧差图像中较为明显的噪声区域;c.获取目标矩形框并计算矩形的面积,当矩形面积满足一定条件时,判断为有人体运动,则对教师板书行为进行检测及识别;d.若连续检测到了写黑板行为超过5帧图像时,则对摄像机进行拉伸处理;e.若连续检测不到写黑板行为超过50帧图像时,则把摄像机的拉伸倍数还原为初始倍数。
-
公开(公告)号:CN120050491A
公开(公告)日:2025-05-27
申请号:CN202510153403.8
申请日:2025-02-12
Applicant: 南京邮电大学
Abstract: 本发明公开了一种基于图模型和多尺度注意力机制的视频摘要方法,本发明涉及计算机视觉技术领域。该基于图模型和多尺度注意力机制的视频摘要方法,通过引入多尺度注意力机制,将局部帧间关系的建模与全局长期依赖关系的建模分开进行,有效降低计算过程中注意力权重的偏差,同时,采用GATv2图注意力机制提取局部帧间的关联性,使用CLS标识符聚合全局特征信息,确保全局与局部信息的高效融合,并且利用非极大值抑制去除冗余帧,进一步提升视频摘要的质量,避免位置信息注入带来的冗余问题,实现更精准的帧间关系建模与视频内容摘要。
-
公开(公告)号:CN118608467A
公开(公告)日:2024-09-06
申请号:CN202410651496.2
申请日:2024-05-24
Applicant: 南京邮电大学
IPC: G06T7/00 , G06T5/50 , G06T5/60 , G06N3/0455 , G06N3/0464 , G06N3/08
Abstract: 本发明公开了一种基于图像特征和语义描述的无参考图像质量评价方法,包括输入文本模型,由Text Transformer编码器提取文本特征,获得文本嵌入;输入图像,将输入图像划分为子图像,由Vision Transformer编码器提取全局图像特征,由CNN编码器提取局部图像特征;将全局图像特征加入通道注意力,与局部图像特征进行交叉注意力操作得到融合特征,获得视觉嵌入;对文本嵌入和视觉嵌入进行余弦相似度计算,使用Softmax对余弦相似度进行归一化;进行概率边缘化处理,得到四种概率,并通过关联五个质量级别的李克特量表及其对应的边际概率得到质量评分;分别计算出损失;对其加权求和,计算整体损失,对整体网络模型进行训练。本发明在图像质量评价任务中具有更好的图像质量预测准确性。
-
-
-
-
-
-
-
-
-