一种基于3D-Gradient引导的屏幕内容视频编码码率控制方法

    公开(公告)号:CN113949872A

    公开(公告)日:2022-01-18

    申请号:CN202111320458.1

    申请日:2021-11-09

    Applicant: 华侨大学

    Abstract: 本发明涉及一种基于3D‑Gradient引导的屏幕内容视频编码码率控制方法,属于视频编码领域。本方法采用3D‑Gradient滤波器同时提取屏幕内容视频序列空域和时域的边缘结构特征以及运动信息,将屏幕内容中空域和时域特征进行融合,获取最终的像素级复杂度因子。通过像素级复杂度因子计算CTU级复杂度因子CF进行CTU级的目标比特分配。利用当前编码帧的参考帧以及重建帧的相似度结合目标比特进行率失真模型的构建,实现目标比特,引导码率控制模型的生成。本发明提出的屏幕内容视频编码码率控制方法能够提高码率控制精度,明显改善重建视频序列的率失真性能,在一定程度上降低视频编码时间复杂度。

    基于剪枝和轻量卷积的车辆再辨识模型压缩方法及系统

    公开(公告)号:CN113554084A

    公开(公告)日:2021-10-26

    申请号:CN202110806449.7

    申请日:2021-07-16

    Abstract: 本发明实例公开了一种基于剪枝和轻量卷积的车辆再辨识模型压缩方法及系统,对待压缩的车辆再辨识模型的骨干网络进行预训练,对预训练完毕的骨干网络进行剪枝,并通过重训练恢复精度,对车辆再辨识模型中特征金字塔模块进行轻量化卷积设计,将紧凑的骨干网络与轻量化的特征金字塔模块结合,骨干网络提取特征后,特征金字塔模块进行特征融合,得到基于特征金字塔联合表示的轻量化车辆再辨识模型。本发明以复杂高性能的车辆再辨识模型作为输入模型,其骨干网络中重要性较低的卷积核被自动选择和剪枝,并改进其特征金字塔模块中的卷积方式,有效降低参数量和计算量,产生精度相当但较为紧凑的模型。

    一种基于局部视频活动度的屏幕视频质量识别方法

    公开(公告)号:CN113014916A

    公开(公告)日:2021-06-22

    申请号:CN202110219595.X

    申请日:2021-02-26

    Applicant: 华侨大学

    Abstract: 本发明公开了一种基于局部视频活动度的屏幕视频质量识别方法,方法包括:分别对参考和失真屏幕视频序列采用3D‑LOG滤波器提取屏幕特征;计算屏幕区域相似度,基于3D‑LOG池化策略得到屏幕质量分数;分别对参考和失真屏幕视频序列采用3D‑NSS方法提取自然特征;计算自然区域相似度,基于池化策略得到自然质量分数;计算局部视频活动度;基于局部视频活动度结合屏幕和自然质量分数获得最终失真屏幕视频质量评价值。本发明充分考虑到人类视觉系统对于屏幕视频的屏幕和自然内容区域感知度不同且人眼对于边缘特征高度敏感,具有较好的失真屏幕视频质量评价性能。

    一种恰可察觉失真模型阈值计算方法

    公开(公告)号:CN109525847B

    公开(公告)日:2021-04-30

    申请号:CN201811345416.1

    申请日:2018-11-13

    Applicant: 华侨大学

    Abstract: 本发明涉及一种恰可察觉失真模型阈值计算方法,其包括:对原始图像进行DCT变换,计算相应的亮度自适应模块值和空间对比敏感度函数模块值;利用8×8DCT块的频率能量分布特点,对图像的纹理块进行更为细致的分类,获取对比度掩蔽因子,计算出对比度掩蔽模块值;利用DCT系数的空间频率分布提取出当前图像块的纹理特征,计算两个不同块之间的纹理差异,得到不同块的视觉感知调整因子;整合上述模块,得到最终的JND阈值。本发明所提的算法,在保证视觉质量的前提下,所提JND模型能容纳更多的噪声。该模型可广泛用于感知图像/视频编码、水印以及质量评价等。

    一种基于张量分解的屏幕内容视频质量分析方法

    公开(公告)号:CN111988613A

    公开(公告)日:2020-11-24

    申请号:CN202010778526.8

    申请日:2020-08-05

    Applicant: 华侨大学

    Abstract: 本发明涉及一种基于张量分解的屏幕内容视频质量分析方法,方法包括:对选定参考屏幕内容视频序列和失真屏幕内容序列分别进行张量分解,得到三方向切片集合的主成分切片;分别提取三方向参考主成分切片和三方向失真主成分切片的Gabor特征图,从而计算得到三方向特征相似度图;基于三方向特征相似度图获得最终失真屏幕内容视频质量分析值。本发明充分利用张量分解理论来描述屏幕内容视频的基本纹理结构,并通过Gabor滤波器提取人眼高度敏感的边缘信息,反映人眼视觉系统对于屏幕内容视频的主观感知度,具有较好的失真屏幕内容视频质量分析性能。

    基于多尺度轮廓波特征的全参考光场图像质量评价方法

    公开(公告)号:CN111524104A

    公开(公告)日:2020-08-11

    申请号:CN202010285704.3

    申请日:2020-04-13

    Applicant: 华侨大学

    Abstract: 本发明涉及一种基于多尺度轮廓波特征的全参考光场图像质量评价方法,基于光场图像表面的轮廓和曲线具有感知相关性,通过具有良好各向异性的多尺度多方向轮廓波变换有效地捕捉光场图像中场景结构变化的边缘和轮廓细节,充分考虑了人眼视觉系统对于光场图像的主观感知度,具有较好的光场图像质量评价性能。本发明的实施,能够得到匹配于人眼视觉的主观感知度的评价结果。

    一种基于身份和非身份属性交互学习的行人属性识别方法

    公开(公告)号:CN110516569A

    公开(公告)日:2019-11-29

    申请号:CN201910753998.5

    申请日:2019-08-15

    Abstract: 本发明提供一种基于身份和非身份属性交互学习的行人属性识别方法。首先,采用一种具有视角变化鲁棒性的特征学习方法对行人图像进行特征表达;其次,将行人属性分为身份属性和非身份属性,对二者之间的潜在关系进行建模,设计出行人身份属性和非身份属性交互学习的目标函数,利用身份属性的识别优势促进非身份属性识别率的提高,并且利用非身份属性识别率的提高反过来进一步改进身份属性的识别效果。行人属性分为身份属性和非身份属性的潜在关系为:相同身份的行人之间,必然具有相同的非身份属性;非身份属性差异大的行人之间,其身份属性差异一般较大。最后,采用mini-batch随机梯度下降算法对目标函数进行优化,实现行人属性的识别。

Patent Agency Ranking