-
公开(公告)号:CN111510721A
公开(公告)日:2020-08-07
申请号:CN202010278978.X
申请日:2020-04-10
Applicant: 华侨大学
IPC: H04N19/39 , H04N19/132 , H04N19/59 , H04N19/124 , H04N19/61
Abstract: 本发明提供了一种基于空间下采样的多描述编码高质量边重建方法,包括,制作数据集:选取视频,通过空间下采样分成两个描述,在量化参数QP值设定下,编码,解码,将解码后的视频和相应的原始视频作为训练集;训练SD-VSRnet网络:每五帧视频作为网络的输入,依次进行特征提取,恢复高频细节,像素重排,再与输入的中间帧进行跳跃连接得到重建的视频帧,逐帧重建获得最后的重建视频,实现SD-VSRnet网络的训练。本发明提出的方法制作了适用于空间下采样的多描述编码高质量边重建的数据集,另外,采用视频超分辨率的神经网络,分别测试4种QP值,可以有效提高不同压缩程度的边缘解码视频重建质量。
-
公开(公告)号:CN110191359A
公开(公告)日:2019-08-30
申请号:CN201910409994.5
申请日:2019-05-16
Applicant: 华侨大学
IPC: H04N21/2343 , H04N21/4402 , G06T9/00
Abstract: 本发明涉及一种基于关键子孔径图像选取的光场图像压缩方法,包括:将光场相机捕获得到的光场图像分解为子孔径图像阵列;根据子孔径图像阵列的结构特性,选取其中少数子孔径图像作为关键子孔径图像,剩余多数子孔径图像作为非关键子孔径图像;将关键子孔径图像按照逐行扫描顺序构建成单个伪视频序列;基于HEVC对伪视频序列进行压缩编码传输;利用已解码少数关键子孔径图像通过端到端的卷积神经网络插值重建出未编传输的多数非关键子孔径图像;将重建的完整子孔径图像阵列复原为光场图像;实现光场图像的高效压缩编码与解码重建。本发明方法,在保证客观重建质量的前提下,能够有效地减少光场图像所需存储空间和传输带宽,实现更高的压缩性能。
-
公开(公告)号:CN106780452B
公开(公告)日:2019-08-06
申请号:CN201611114594.4
申请日:2016-12-07
Applicant: 华侨大学
Abstract: 本发明涉及一种结合小波和角点特征的全参考屏幕图像质量评估方法。该方法首先分别提取参考屏幕图像和失真屏幕图像的角点特征相似性图,并以小波变换系数幅值来权衡参考屏幕图像的视觉敏感度,基于该视觉敏感度对角点特征相似性图进行加权融合,从而计算得到失真屏幕图像质量分数。本发明充分利用了角点特征对于图像局部结构的描述能力且考虑到了人眼视觉感知对屏幕图像中不同区域的视觉敏感程度不同,具有较好的屏幕图像质量评估性能,且计算简单。
-
公开(公告)号:CN110072113A
公开(公告)日:2019-07-30
申请号:CN201910414604.3
申请日:2019-05-17
Applicant: 华侨大学
IPC: H04N19/597 , H04N19/109 , H04N19/503 , H04N13/161
Abstract: 本发明涉及一种基于贝叶斯决策的3D-HEVC深度图帧间快速算法,属于视频编码领域,本方法包括CU尺寸判决和模式快速选择。首先,提取当前CU划分或者不划分时,遍历完DIS模式的RDcost作为特征,通过离线训练高斯模型,并且计算损失函数,将后验概率与损失函数作比较,判断当前CU是否为最佳尺寸;其次,提取最优模式是否是SKIP或者DIS时,遍历完SKIP或者DIS的RDcost作为特征,引入全零块,通过最小错误贝叶斯判决,判断当前最优模式是否是SKIP或者DIS。本发明一种基于贝叶斯决策的3D-HEVC深度图帧间快速算法能够减少编码器计算开销,在保持编码性能基本不变的情况下,减少编码时间。
-
公开(公告)号:CN108875906B
公开(公告)日:2019-06-04
申请号:CN201810359791.5
申请日:2018-04-20
Applicant: 华侨大学
Abstract: 本发明涉及一种多尺度逐步累加的卷积神经网络学习方法,可广泛应用于机器视觉和人工智能领域,例如目标检测、目标分类、目标识别等。首先,本发明采用均值池化操作对输入图像构建多尺度图像金字塔;然后,将各个不同尺度的图像逐步送入卷积神经网络,让卷积神经网络随着网络深度的逐步深入,能够在多种不同尺度的图像上进行学习并进行特征逐步累加,从提高了而卷积神经网络的特征学习能力。
-
公开(公告)号:CN109525847A
公开(公告)日:2019-03-26
申请号:CN201811345416.1
申请日:2018-11-13
Applicant: 华侨大学
IPC: H04N19/625 , H04N19/176 , H04N19/137 , H04N19/14
Abstract: 本发明涉及一种恰可察觉失真模型阈值计算方法,其包括:对原始图像进行DCT变换,计算相应的亮度自适应模块值和空间对比敏感度函数模块值;利用8×8DCT块的频率能量分布特点,对图像的纹理块进行更为细致的分类,获取对比度掩蔽因子,计算出对比度掩蔽模块值;利用DCT系数的空间频率分布提取出当前图像块的纹理特征,计算两个不同块之间的纹理差异,得到不同块的视觉感知调整因子;整合上述模块,得到最终的JND阈值。本发明所提的算法,在保证视觉质量的前提下,所提JND模型能容纳更多的噪声。该模型可广泛用于感知图像/视频编码、水印以及质量评价等。
-
公开(公告)号:CN108875754A
公开(公告)日:2018-11-23
申请号:CN201810426492.9
申请日:2018-05-07
Applicant: 华侨大学
Abstract: 本发明涉及一种基于多深度特征融合的车辆再识别方法,包括:提取训练车辆图像的深度ID特征,提取训练车辆图像的深度颜色特征,提取训练车辆图像的深度车型特征,将提取的三种深度特征进行组合,获得融合特征,通过Softmax分类函数对融合后的深度特征进行分类。本发明对输入的车辆图像提取深度ID特征、深度颜色特征和深度车型特征并进行有效地融合,实现三种深度特征的互补,获得更有表征能力的融合特征,从而实现准确的车辆再识别。
-
公开(公告)号:CN108846475A
公开(公告)日:2018-11-20
申请号:CN201810542036.0
申请日:2018-05-30
Applicant: 华侨大学
IPC: G06N3/04
Abstract: 本发明涉及一种分段密集连接型深度网络构建方法,首先把深度网络中各串连续连接的卷积层划分为多个小段;其次,对每个小段内的卷积层进行密集连接,即段内密集连接;然后,对每个小段进行密集连接,即段间密集连接,从而实现了对连续连接的卷积层的分段密集连接。最后,在各串连续连接的卷积层之间配合上最大池化层,并在最后的最大池化层之后配上全连接层,就完成了分段密集连接型深度网络的构建。借助分段密集连接的机制,一方面有利于训练更深的深度网络,进而有利提升深度网络的特征学习能力;另一方面,由于分段划分,各个小段内只包含少数卷积层,能够有效地避免因密集连接所带来的庞大计算量。
-
公开(公告)号:CN108447059A
公开(公告)日:2018-08-24
申请号:CN201810311096.1
申请日:2018-04-09
Applicant: 华侨大学
IPC: G06T7/00
Abstract: 本发明提出一种全参考光场图像质量评价方法。考虑到人眼视觉特性对结构、对比度等较为敏感,在频域里,利用哈尔变换提取高频边缘信息和低频亮度信息,计算频域边缘相似性和亮度相似性;在空域里,提取图像对比度结构特征和亮度特征,分别计算空域对比度结构相似性和亮度相似性;最后将频域和空域信息进行融合得到最终光场图像质量预测分数。该方法计算简单,复杂度低,能很好的评价光场图像质量分数。
-
公开(公告)号:CN107507166A
公开(公告)日:2017-12-22
申请号:CN201710600174.5
申请日:2017-07-21
Applicant: 华侨大学
CPC classification number: G06T7/0004 , G06K9/4647 , G06K9/6269 , G06T2207/30168
Abstract: 本发明涉及一种基于支持向量回归的无参考屏幕图像质量评估方法,计算方向梯度直方图,作为失真屏幕图像的特征信息,利用支持向量回归(SVR)网络进行训练,得到屏幕图像特征信息与主观质量分数的映射关系模型,以准确评估屏幕图像质量。本发明所述的方法无需参考屏幕图像,计算得到的客观分数与人眼视觉感知具有较高的一致性,且其计算简单。
-
-
-
-
-
-
-
-
-