一种考虑显著度的基于隐式神经表示的视频编码方法

    公开(公告)号:CN119583797A

    公开(公告)日:2025-03-07

    申请号:CN202411706795.8

    申请日:2024-11-26

    Applicant: 同济大学

    Inventor: 张冬冬 曹乾

    Abstract: 本发明提出了一种考虑显著度的基于隐式神经表示的视频编码方法,包括:原始视频预处理;构建基于多尺度特征网格的视频隐式神经表示网络,包括多尺度特征网格和解码器;通过显著度指导的训练策略优化模型;将多尺度特征网格和解码器作为压缩数据进行压缩,得到视频码流;发送并解压视频码流,将每一帧的帧索引通过特征网格生成特征嵌入,将特征嵌入输入解码器输出对应的重构图像,按顺序排列,得到解码的视频。本发明将视频编码在一个隐式神经网络中,提出多尺度特征网格和基于轻量化卷积神经网络的解码器,显著提高视频重建的客观质量,并引入显著度预处理和显著度指导的训练方式,综合提高视频重建的视觉质量。

    一种基于隐式神经表示的质量可伸缩视频编码方法

    公开(公告)号:CN118101961A

    公开(公告)日:2024-05-28

    申请号:CN202311869124.9

    申请日:2023-12-30

    Applicant: 同济大学

    Inventor: 张冬冬 曹乾

    Abstract: 一种基于隐式神经表示的质量可伸缩视频编码方法,包括:原始视频预处理;构建质量可伸缩的视频隐式神经表示网络,包括一个基本层和多个增强层网络,基本层网络包括内容编码器、上下文编码器和解码器,每个增强层网络包括残差编码器和解码器;训练并优化模型;将基本层解码器、增强层解码器和每一帧经过编码器编码后的嵌入作为压缩数据进行压缩,得到可分层的视频码流;根据需求发送并解压缩部分层的视频码流,将每一帧的特征嵌入输入解码器,输出对应的重构图像,按顺序排列,得到解码的视频。本发明将视频按照渐进质量分层编码在一个分层结构的隐式神经网络中,从而节省了训练时间和存储空间,并显著提高视频的重建质量。

Patent Agency Ranking