-
公开(公告)号:CN111510721B
公开(公告)日:2022-11-01
申请号:CN202010278978.X
申请日:2020-04-10
Applicant: 华侨大学
IPC: H04N19/39 , H04N19/132 , H04N19/59 , H04N19/124 , H04N19/61
Abstract: 本发明提供了一种基于空间下采样的多描述编码高质量边重建方法,包括,制作数据集:选取视频,通过空间下采样分成两个描述,在量化参数QP值设定下,编码,解码,将解码后的视频和相应的原始视频作为训练集;训练SD‑VSRnet网络:每五帧视频作为网络的输入,依次进行特征提取,恢复高频细节,像素重排,再与输入的中间帧进行跳跃连接得到重建的视频帧,逐帧重建获得最后的重建视频,实现SD‑VSRnet网络的训练。本发明提出的方法制作了适用于空间下采样的多描述编码高质量边重建的数据集,另外,采用视频超分辨率的神经网络,分别测试4种QP值,可以有效提高不同压缩程度的边缘解码视频重建质量。
-
公开(公告)号:CN114972812A
公开(公告)日:2022-08-30
申请号:CN202210624115.2
申请日:2022-06-02
Applicant: 华侨大学 , 厦门亿联网络技术股份有限公司
Abstract: 本发明提供一种基于结构相似度的非局部注意力学习方法,可广泛应用于机器视觉领域,例如图像分割、图像分类、图像识别等。现有非局部注意力方法简单计算不同空域位置的两个信号内积作为二者的相似度度量,并不完全符合人类视觉感知特点。针对这一问题,本发明提出利用结构相似度衡量不同空域位置的信号之间的相似度,在非局部注意力学习方法中充分考虑人类视觉对信号感知三个重要因素,即亮度、对比度和结构。其次,本发明进一步提出多尺度结构相似度度量策略,在不同尺度上更为全面地进行信号相似度度量。因此,本发明能够取得比现有非局部注意力方法更好地注意力学习效果。
-
公开(公告)号:CN114817596A
公开(公告)日:2022-07-29
申请号:CN202210390000.1
申请日:2022-04-14
Applicant: 华侨大学
IPC: G06F16/532 , G06F16/583 , G06V10/80 , G06V10/764 , G06V10/82 , G06K9/62 , G06N3/04 , G06N3/08
Abstract: 本发明提出一种融合语义相似性嵌入和度量学习的跨模态图文检索方法,具体包括:首先构建特征嵌入模块抽取每个模态的深度特征,然后在图像和文本的单模态表征空间和跨模态公共表征空间通过标签域监督信息和语义一致性监督信息分别进行表征学习。同时,设计一个深度相似性度量网络对融合后的图像文本对进行相似性比较,得到相似性得分,通过语义相似性矩阵监督相似性学习。通过损失函数将模型统一到一个整体的框架内,训练可得到端到端的跨模态图文检索模型。通过实验表明,本发明能够有效解决跨模态图文检索中精确度不高的问题。
-
公开(公告)号:CN114710667A
公开(公告)日:2022-07-05
申请号:CN202210269314.6
申请日:2022-03-18
Applicant: 华侨大学
IPC: H04N19/107 , H04N19/11 , H04N19/96
Abstract: 本发明公开了一种针对H.266/VVC屏幕内容帧内CU划分的快速预测方法及装置,通过收集屏幕内容视频建立数据库,用于训练模型;构建宽度自适应网络模型,预测两种不同尺寸CU的划分方式,预测步骤如下:先采用网络模型对64×64大小的CU进行划分方式预测,若为不划分,则停止CU的RD代价计算,若为划分,则得到4个32×32大小的CU,则采用网络模型对32×32大小的CU的划分方式进行预测,若为不划分,则停止RD的代价计算,若为四叉树划分,则得到4个16×16的CU:若为多种类型叉树划分,则需要依靠标准编码器进行计算;最后设定适当的预设阈值来提高预测准确率。本发明能够在保持H.266/VVC编码效率的前提下,有效地降低H.266/VVC屏幕内容的帧内预测编码计算复杂度。
-
公开(公告)号:CN109166160B
公开(公告)日:2022-07-01
申请号:CN201811082243.9
申请日:2018-09-17
Applicant: 华侨大学
IPC: G06T9/00
Abstract: 本发明公开了一种采用图形预测的三维点云压缩方法,属于视频编码领域,方法包括:采用KD树对输入三维点云进行自适应分块;采用KNN算法计算编码单元内每个点的K邻近点;构建每个单元块的图并计算图形平移算子;对每个编码单元的块进行去均值,采用K‑means算法对编码单元进行自适应采样,通过求解优化问题对未采样点进行预测;利用基于KD树的块均值预测算法对每个编码单元块的均值进行预测编码;最后用算术编码器对所有量化的参数和残差进行熵编码。本发明采用图形预测,能够对庞大的三维点云数据进行有效压缩,极大地改善三维点云的传输和存储效率。
-
公开(公告)号:CN108875754B
公开(公告)日:2022-04-05
申请号:CN201810426492.9
申请日:2018-05-07
Applicant: 华侨大学
IPC: G06V10/44 , G06V10/764 , G06K9/62
Abstract: 本发明涉及一种基于多深度特征融合的车辆再识别方法,包括:提取训练车辆图像的深度ID特征,提取训练车辆图像的深度颜色特征,提取训练车辆图像的深度车型特征,将提取的三种深度特征进行组合,获得融合特征,通过Softmax分类函数对融合后的深度特征进行分类。本发明对输入的车辆图像提取深度ID特征、深度颜色特征和深度车型特征并进行有效地融合,实现三种深度特征的互补,获得更有表征能力的融合特征,从而实现准确的车辆再识别。
-
公开(公告)号:CN113949872A
公开(公告)日:2022-01-18
申请号:CN202111320458.1
申请日:2021-11-09
Applicant: 华侨大学
IPC: H04N19/147 , H04N19/70
Abstract: 本发明涉及一种基于3D‑Gradient引导的屏幕内容视频编码码率控制方法,属于视频编码领域。本方法采用3D‑Gradient滤波器同时提取屏幕内容视频序列空域和时域的边缘结构特征以及运动信息,将屏幕内容中空域和时域特征进行融合,获取最终的像素级复杂度因子。通过像素级复杂度因子计算CTU级复杂度因子CF进行CTU级的目标比特分配。利用当前编码帧的参考帧以及重建帧的相似度结合目标比特进行率失真模型的构建,实现目标比特,引导码率控制模型的生成。本发明提出的屏幕内容视频编码码率控制方法能够提高码率控制精度,明显改善重建视频序列的率失真性能,在一定程度上降低视频编码时间复杂度。
-
公开(公告)号:CN113554084A
公开(公告)日:2021-10-26
申请号:CN202110806449.7
申请日:2021-07-16
Applicant: 华侨大学 , 厦门亿联网络技术股份有限公司 , 星宸科技股份有限公司
Abstract: 本发明实例公开了一种基于剪枝和轻量卷积的车辆再辨识模型压缩方法及系统,对待压缩的车辆再辨识模型的骨干网络进行预训练,对预训练完毕的骨干网络进行剪枝,并通过重训练恢复精度,对车辆再辨识模型中特征金字塔模块进行轻量化卷积设计,将紧凑的骨干网络与轻量化的特征金字塔模块结合,骨干网络提取特征后,特征金字塔模块进行特征融合,得到基于特征金字塔联合表示的轻量化车辆再辨识模型。本发明以复杂高性能的车辆再辨识模型作为输入模型,其骨干网络中重要性较低的卷积核被自动选择和剪枝,并改进其特征金字塔模块中的卷积方式,有效降低参数量和计算量,产生精度相当但较为紧凑的模型。
-
公开(公告)号:CN109063535B
公开(公告)日:2021-09-28
申请号:CN201810541294.7
申请日:2018-05-30
Applicant: 华侨大学
Abstract: 本发明涉及一种基于联合深度学习的行人再辨识和行人性别分类方法,可同时预测行人身份和行人性别。首先,构建两个结构相同的深度网络,分别用于行人再辨识和行人性别分类;其次,利用参数相关正则项约束两个结构相同的深度网络中各层的参数集,使得二者参数的优化过程中不至于发生过大的偏离,以避免过拟合,从而同时提升行人再辨识与行人性别分类的准确率。
-
公开(公告)号:CN113014916A
公开(公告)日:2021-06-22
申请号:CN202110219595.X
申请日:2021-02-26
Applicant: 华侨大学
IPC: H04N17/00
Abstract: 本发明公开了一种基于局部视频活动度的屏幕视频质量识别方法,方法包括:分别对参考和失真屏幕视频序列采用3D‑LOG滤波器提取屏幕特征;计算屏幕区域相似度,基于3D‑LOG池化策略得到屏幕质量分数;分别对参考和失真屏幕视频序列采用3D‑NSS方法提取自然特征;计算自然区域相似度,基于池化策略得到自然质量分数;计算局部视频活动度;基于局部视频活动度结合屏幕和自然质量分数获得最终失真屏幕视频质量评价值。本发明充分考虑到人类视觉系统对于屏幕视频的屏幕和自然内容区域感知度不同且人眼对于边缘特征高度敏感,具有较好的失真屏幕视频质量评价性能。
-
-
-
-
-
-
-
-
-