-
公开(公告)号:CN115620343A
公开(公告)日:2023-01-17
申请号:CN202211386276.9
申请日:2022-11-07
Applicant: 华侨大学 , 厦门亿联网络技术股份有限公司
Abstract: 本发明提供一种基于多代理相似度聚合的跨模态行人再辨识方法,用于解决昼夜光照差异大而带来的白天可见光图像与夜晚红外图像匹配困难的问题。因此,本发明为每个类别分配多个可学习的代理,获得多代理相似度,并设计多代理相似度聚合机制,实现跨模态行人再辨识。一方面,本发明为每个类别学习多个代理,可以更好地刻画由于数据跨模态引起的剧烈类内差异;另一方面,本发明设计聚合机制,学习最佳的多代理相似度聚合方式,提升跨模态行人再辨识的准确性。因此,本发明可广泛应用于智慧城市、智慧交通以及智慧安防中的智能视频监控系统。
-
公开(公告)号:CN115511730A
公开(公告)日:2022-12-23
申请号:CN202211073159.7
申请日:2022-09-02
Applicant: 华侨大学
Abstract: 本发明涉及一种基于循环生成对抗网络的图像频闪去除方法,其在合成频闪图像数据集的基础上训练得到循环生成对抗网络模型,其包含两个生成网络与两个鉴别网络,两个生成网络分别负责由输入的频闪图像生成无频闪图像与输入无频闪图像生成频闪图像,鉴别网络利用输入的真实图像与生成网络的生成图像,结合生成对抗思想,训练生成网络。最终达到输入频闪图像最终输出其对应的无频闪图像的目的,有效提高了图像去频闪方法的实用性。
-
公开(公告)号:CN115396667A
公开(公告)日:2022-11-25
申请号:CN202211005433.7
申请日:2022-08-22
Applicant: 华侨大学
IPC: H04N19/124 , H04N19/154 , H04N19/70 , H04N19/82
Abstract: 本发明涉及一种基于可变形卷积的宽QP范围环路滤波方法,属于视频编码领域。本方法利用可变形卷积灵活的感受野与形变建模能力,自动学习视频特征,并通过密集残差连接,进行特征强化,以达到增强压缩视频质量的目的;同时提出一种QP注意力模块,提高该方法的泛化能力,使该方法能够同时提升不同QP下的压缩视频质量。本发明方法能够显著提升压缩视频的主客观质量。
-
公开(公告)号:CN113038126B
公开(公告)日:2022-11-01
申请号:CN202110261181.3
申请日:2021-03-10
Applicant: 华侨大学
IPC: H04N19/122 , H04N19/124 , H04N19/13 , H04N19/184 , H04N19/42 , H04N19/625 , G06N3/04 , H04N7/01
Abstract: 基于帧预测神经网络的多描述视频编码方法和解码方法,本发明在编码端将源视频采用时间下采样的方法分为奇数帧和偶数帧,分别将奇数帧和偶数帧组成两个新的序列,通过HEVC编码器进行编码。针对时间下采样所导致的帧丢失问题,采用帧预测神经网络来分别预测对应序列中所丢失的帧。将预测帧与对应序列的已编码视频帧相减获得残差信息,与当前序列已编码信息组成一个描述。将两个描述的码流打包分别通过不同的信道传输到解码端。本发明方法构成的多描述视频编码使码流具有一定的差错恢复能力,解码端可充分利用描述间的相关信息保证解码端在不可靠网络传输下的高质量视频重建。
-
公开(公告)号:CN113014916B
公开(公告)日:2022-11-01
申请号:CN202110219595.X
申请日:2021-02-26
Applicant: 华侨大学
IPC: H04N17/00
Abstract: 本发明公开了一种基于局部视频活动度的屏幕视频质量识别方法,方法包括:分别对参考和失真屏幕视频序列采用3D‑LOG滤波器提取屏幕特征;计算屏幕区域相似度,基于3D‑LOG池化策略得到屏幕质量分数;分别对参考和失真屏幕视频序列采用3D‑NSS方法提取自然特征;计算自然区域相似度,基于池化策略得到自然质量分数;计算局部视频活动度;基于局部视频活动度结合屏幕和自然质量分数获得最终失真屏幕视频质量评价值。本发明充分考虑到人类视觉系统对于屏幕视频的屏幕和自然内容区域感知度不同且人眼对于边缘特征高度敏感,具有较好的失真屏幕视频质量评价性能。
-
公开(公告)号:CN109801273B
公开(公告)日:2022-11-01
申请号:CN201910016167.X
申请日:2019-01-08
Applicant: 华侨大学
Abstract: 本发明涉及一种基于极平面线性相似度的光场图像质量评价方法,属于图像处理领域,根据人类视觉系统理解光场图像时对场景结构变化的敏感性和光场图像中包含丰富的场景结构变化信息提出,方法包括:对参考光场图像和失真光场图像分别提取极平面图;接着分别提取参考极平面图和失真极平面图的线性特征图,进而计算得到极平面线性特征相似度图;基于极平面线性相似度图得到最终失真光场图像质量评价值。本发明充分利用极平面线性特征来描述光场图像中场景结构变化,从而评价失真光场图像的质量,反映人眼主观视觉系统对于光场图像的主观感知度,具有较好的光场图像质量评价性能。
-
公开(公告)号:CN110399886B
公开(公告)日:2022-09-30
申请号:CN201910635863.9
申请日:2019-07-15
Applicant: 华侨大学
Abstract: 本发明涉及一种屏幕图像JND模型构建方法。首先利用文本分割技术得到屏幕图像的文本区域;其次提取文本区域的边缘像素,将屏幕图像分为文本边缘区域和非文本边缘区域;然后利用边缘宽度和边缘对比度计算出边缘结构失真敏感度和边缘对比度掩蔽,得到文本边缘区域视觉掩蔽模型;接着计算出非文本边缘区域的亮度自适应和对比度掩蔽效应,得到非文本边缘区域视觉掩蔽模型;最后结合文本边缘区域和非文本边缘区域的视觉掩蔽模型得到屏幕图像JND模型。本发明充分考虑屏幕图像特点以及人眼对屏幕图像不同区域具有不同的视觉感知特性等因素,对屏幕图像的视觉冗余信息有较为准确的估计,可广泛地应用到屏幕图像技术领域。
-
公开(公告)号:CN110309770B
公开(公告)日:2022-09-30
申请号:CN201910577021.2
申请日:2019-06-28
Applicant: 华侨大学
Abstract: 本发明涉及一种基于四元组损失度量学习的车辆再辨识方法,包括:构建参数共享的四分支卷积神经网络,设计四元组损失函数,对输入的四元组图像进行距离度量学习。本发明特别考虑了车辆再辨识中的特殊难点,即,车型和颜色都相同的车辆具有非常相似的车辆外观,能够有效地解决车辆再辨识中对于高相似度车辆识别精度不高的问题。
-
公开(公告)号:CN115115983A
公开(公告)日:2022-09-27
申请号:CN202210724179.X
申请日:2022-06-24
Applicant: 华侨大学
Abstract: 本发明公开一种基于时空稀疏字典的全参考屏幕视频质量评价方法及系统,包括:将输入参考和失真屏幕视频进行预处理分割成屏幕视频块;采用两种不同尺度的3D‑DOG滤波器对输入训练数据进行预处理,基于K‑TSVD模型训练两个不同尺度的稀疏字典;使用所得两种不同尺度的稀疏字典进行特征提取;基于提取到的特征计算参考和失真屏幕视频的相似度;采用时空池化策略计算屏幕视频对应的质量分数。本发明符合人类视觉系统主观感知和屏幕视频特点,具有较好的屏幕视频质量评价效果。
-
公开(公告)号:CN112365559B
公开(公告)日:2022-08-26
申请号:CN202011305117.2
申请日:2020-11-19
Applicant: 华侨大学
Abstract: 本发明涉及一种基于结构相似度的生成对抗网络的红外图像着色方法,构造一个基于结构相似度的生成对抗网络,包括生成器和鉴别器;鉴别器能够区别图像是来自红外图像域或是来自彩色图像域,对生成器采用基于生成对抗网络的损失函数、基于一范或二范的循环一致损失函数和重构损失函数、基于结构相似度的损失函数,使生成器能够生成色彩逼真且边缘清晰的彩色图像;利用预先采集的红外图像和彩色图像将所提出的基于结构相似度的生成对抗网络训练到收敛条件,所获得的生成器即可实现对红外图像的着色。本发明不仅能保留红外成像在夜间拍摄的优势,也能利于人眼能够更好更快的捕捉到图像中的有用信息,充分发挥图像价值,从而促进夜视成像技术的发展。
-
-
-
-
-
-
-
-
-