基于3D-HEVC的纹理视频和深度图码率分配方法

    公开(公告)号:CN104717515A

    公开(公告)日:2015-06-17

    申请号:CN201510130753.9

    申请日:2015-03-24

    Applicant: 上海大学

    Abstract: 本发明提供一种基于3D-HEVC的纹理视频和深度图编码的码率分配的方法,其包括以下步骤:步骤一,预编码一个图像组,获得纹理相关参数;步骤二,预编码另一个图像组,得到深度图的Lambda-R曲线模型参数和R-D曲线模型参数;步骤三,得到纹理的纹理视频的Lambda-R曲线参数、深度图的Lambda-R曲线参数、深度图的Lambda-R曲线参数、纹理视频的R-D曲线参数;步骤四,求解出最优的纹理和深度比特率;步骤五,利用提案JCTVC-K0103方法计算出编码纹理视频跟深度图的量化参数QP对序列进行编码。本发明能有效提高编码质量。

    基于视觉关注度的视频编码方法

    公开(公告)号:CN101184221A

    公开(公告)日:2008-05-21

    申请号:CN200710171846.1

    申请日:2007-12-06

    Applicant: 上海大学

    Abstract: 本发明涉及一种基于视觉关注度视频编码方法。本方法是将人眼视觉关注特性引入到视频编码中:通过对宏块局部运动度、边缘强度以及纹理活动度的分析,将宏块归类为:局部运动宏块、边缘宏块、平滑宏块以及纹理宏块;基于人眼对于这四种类型宏块关注度的不同,调节宏块的量化参数。本发明在增加不到4%的计算量的同时,可提高10%编码效率,且能改善视频编码的主观质量。

    基于H.264实时精细粒度可伸缩编码方法

    公开(公告)号:CN101106695A

    公开(公告)日:2008-01-16

    申请号:CN200710038784.7

    申请日:2007-03-29

    Abstract: 本发明涉及基于H.264实时精细粒度可伸缩编码方法。根据当前残差帧的全局性与当前残差块的局部性分布来进行分析,在全局分析中找出奇异点,并通过对奇异值进行下移位使得比特平面数全局均衡,在解码端作相应的上移位;在局部分析中做全零块的判决。本发明在编码过程中的增强层变换部分将采用4×4整数变换。本方法与一般的FGS方法相比,复杂度明显降低,视频质量更高,整体PSNR(峰值信噪比)变化更加平滑。实验表明,与MPEG-4的FGS方法相比,在保持相近的码率时,本发明能够在平均亮度PSNR上提高0.37dB,平均编码速度快13.86fps,即提高97%。

    一种极低码率下的水下图像压缩方法、装置及存储介质

    公开(公告)号:CN119324996A

    公开(公告)日:2025-01-17

    申请号:CN202411499272.0

    申请日:2024-10-25

    Applicant: 上海大学

    Abstract: 本发明涉及一种极低码率下的水下图像压缩方法、装置及存储介质。其中的方法获取原始水下图像后,从中提取前景图像和语义图,基于前景图像,利用预设的前景图像高像素保真度压缩器获取解码的前景图像,并基于语义图与解码的前景图像,利用预设的背景图像高感知保真度压缩器获取重建的水下图像;其中,前景图像高像素保真度压缩器包括依次连接的前景目标编码器和前景目标解码器,前景目标解码器包括水下先验引导模块,背景图像高感知保真度压缩器包括依次连接的语义图编码器‑解码器和前景辅助的背景生成网络。与现有技术相比,本发明具有确保整张水下图像的高感知保真质量与前景目标的高像素保真质量、提升水下图像的压缩效率等优点。

    一种基于对比学习的水下目标检测方法、设备和介质

    公开(公告)号:CN119206463A

    公开(公告)日:2024-12-27

    申请号:CN202411298182.5

    申请日:2024-09-18

    Applicant: 上海大学

    Inventor: 沈礼权 曹磊

    Abstract: 本发明涉及一种基于对比学习的水下目标检测方法、设备和介质,包括以下步骤:获取水下图像,输入训练好的基于对比学习的水下目标检测模型,获得水下目标检测结果;其中,所述基于对比学习的水下目标检测模型包括依次相连的主干网络、特征金字塔网络和分类回归网络,以及与主干网络相连的目标检测精度评估模块和对比特征增强模块;其中,所述目标检测精度评估模块用于计算不同图像增强方法的检测分数,据此生成与原始图像相对应的正样本和负样本;所述对比特征增强模块用于根据正样本和负样本,通过对比学习方法引导所述主干网络提取接近正样本特征的特征。与现有技术相比,本发明可以进一步提高水下目标检测的精度。

    一种基于先验引导的水下增强图像质量评价方法、设备和介质

    公开(公告)号:CN119205697A

    公开(公告)日:2024-12-27

    申请号:CN202411342178.4

    申请日:2024-09-25

    Applicant: 上海大学

    Abstract: 本发明涉及一种基于先验引导的水下增强图像质量评价方法、设备和介质,包括以下步骤:将增强后的水下图像输入基于先验引导的水下增强图像质量评价网络,获得水下增强图像的质量得分;上述网络包括先验估计模块、先验引导模块和质量评估模块,先验估计模块用于根据未经增强的水下图像提取先验信息,先验信息包括二维深度图和一维先验参数,一维先验参数包括吸收系数、散射系数、最大最小物体与水面的距离和背景光;先验引导模块用于将基于先验信息提取的先验特征与基于增强水下图像提取的卷积特征融合获得融合特征;质量评估模块用于根据融合特征预测增强后的水下图像的质量得分。与现有技术相比,本发明可以提高水下增强图像质量评价的准确性。

    一种幻灯片切换检测方法、系统、终端及存储介质

    公开(公告)号:CN109934188B

    公开(公告)日:2020-10-30

    申请号:CN201910208617.5

    申请日:2019-03-19

    Applicant: 上海大学

    Abstract: 本发明提供一种幻灯片切换检测方法,包括:在卷积神经网络结构后连接一个三分类输出层,用以获得视频帧卷的分类信息,得到三分类卷积神经网络模型;在三分类卷积神经网络模型的结构、3D ConvNet网络中的3D卷积模块和ResNet网络中的残差模块的基础上设计时、空残差网络模型;利用3D卷积模块来提取视频帧的时、空特征,将残差模块融入到3D卷积模块中得到3D卷积残差模块,构建用于视频帧卷分类的时、空残差网络模型。本发明还提供对应的检测系统、终端、计算机可读存储介质。本发明准确性更好,克服演讲视频有镜头移动、演讲者移动和多个PTZ镜头切换干扰,并且比现有方法精确度高。

    基于多特征融合的全参考高动态图像质量评价方法

    公开(公告)号:CN111768362A

    公开(公告)日:2020-10-13

    申请号:CN202010399881.4

    申请日:2020-05-13

    Applicant: 上海大学

    Abstract: 本发明专利提供了一种基于多特征融合的全参考高动态图像质量评价方法。该方法主要分为特征提取阶段以及训练回归阶段。在特征提取阶段分三个方向提取图像的特征,使用颜色相似度方法提取方法在颜色方向分别提取了图像的两种颜色相似度特征;在视觉对比差异方向我们采用视觉差异预测方法来提取视觉对比差异特征;再针对多尺度综合特征方向我们使用log-Gabor滤波器在不同频率尺度和方向上提取多尺度特征。在训练回归阶段运用机器学习的方法预测高动态图像的质量。本发明提出的算法能够准确有效地预测高动态图像的质量。

    基于自然场景统计的无参考立体图像质量评价方法

    公开(公告)号:CN105654142B

    公开(公告)日:2019-07-23

    申请号:CN201610006517.0

    申请日:2016-01-06

    Applicant: 上海大学

    Abstract: 本发明公开了一种基于自然场景统计的无参考立体图像质量评价方法。其主要步骤如下:(1)利用能量增益控制双目融合模型来对立体图像中的左右图像进行融合,生成中央眼图像;(2)在上述得到的中央眼图像上进行分析,提取能够准确地反映2D图像质量的相关特征;(3)利用视差匹配算法来计算立体图像的双目视差;(4)根据上一步中计算得到的双目视差和其他3D视觉特性来提取能影响3D视觉感知质量的特征;(5)最后,由上述得到的2D特征和3D特征构成特征向量,利用支持向量机进行模型训练和测试。本发明提出的方法能够准确的预测立体图像质量的客观值,且与人眼感知有很高的吻合性。

    一种幻灯片切换检测方法、系统、终端及存储介质

    公开(公告)号:CN109934188A

    公开(公告)日:2019-06-25

    申请号:CN201910208617.5

    申请日:2019-03-19

    Applicant: 上海大学

    Abstract: 本发明提供一种幻灯片切换检测方法,包括:在卷积神经网络结构后连接一个三分类输出层,用以获得视频帧卷的分类信息,得到三分类卷积神经网络模型;在三分类卷积神经网络模型的结构、3D ConvNet网络中的3D卷积模块和ResNet网络中的残差模块的基础上设计时、空残差网络模型;利用3D卷积模块来提取视频帧的时、空特征,将残差模块融入到3D卷积模块中得到3D卷积残差模块,构建用于视频帧卷分类的时、空残差网络模型。本发明还提供对应的检测系统、终端、计算机可读存储介质。本发明准确性更好,克服演讲视频有镜头移动、演讲者移动和多个PTZ镜头切换干扰,并且比现有方法精确度高。

Patent Agency Ranking