一种可扩展人机协同图像编码方法及编码系统

    公开(公告)号:CN113132755A

    公开(公告)日:2021-07-16

    申请号:CN201911415561.7

    申请日:2019-12-31

    Applicant: 北京大学

    Abstract: 本发明公开了一种可扩展人机协同图像编码方法及编码系统。本方法为:提取各样本图片的边缘图并矢量化,作为驱动机器视觉任务的紧凑表示;在矢量化后的边缘图中进行关键点提取作为辅助信息;对紧凑表示和辅助信息分别进行熵编码无损压缩,获得两路码流;对两路码流进行初步解码,获得边缘图以及辅助信息;将解码得到的边缘图以及辅助信息输入生成神经网络中,进行网络的前向计算;根据得到的计算结果与对应原始图片进行损失函数计算,并将计算的损失反向传播到神经网络进行网络权值更新直到神经网络收敛,得到双路码流解码器;获取待处理图像的边缘图和辅助信息并编码压缩后得到两路码流;双路码流解码器对收到的码流解码,重建图像。

    一种粗粒度上下文熵编码方法

    公开(公告)号:CN113347422B

    公开(公告)日:2022-07-12

    申请号:CN202110521800.8

    申请日:2021-05-13

    Applicant: 北京大学

    Abstract: 本发明公开了一种粗粒度上下文熵编码方法。本方法为:1)从图像数据集中选取一原始图像并送入神经网络的编码器中进行编码;2)对编码后的张量进行划分;将每一子张量视为一待编码块;3)熵编码网络对每一待编码块进行上下文熵编码,获得待编码块的上下文信息;4)将每一上下文信息送入概率预测网络中,获得对应待编码块所有元素的概率分布参数;5)根据概率分布参数计算张量信息熵;将张量送入解码器,得到解码重建图像并计算失真项损失函数的损失值;6)根据步骤5)所得结果计算率失真损失函数的损失值并反向传播到神经网络各层;7)重复步骤1)‑6)直到神经网络收敛;8)将目标图像送入训练后的神经网络得到目标图像的编码。

    可扩展人机协同图像编码方法及系统、解码器训练方法

    公开(公告)号:CN113132755B

    公开(公告)日:2022-04-01

    申请号:CN201911415561.7

    申请日:2019-12-31

    Applicant: 北京大学

    Abstract: 本发明公开了一种可扩展人机协同图像编码方法及编码系统。本方法为:提取各样本图片的边缘图并矢量化,作为驱动机器视觉任务的紧凑表示;在矢量化后的边缘图中进行关键点提取作为辅助信息;对紧凑表示和辅助信息分别进行熵编码无损压缩,获得两路码流;对两路码流进行初步解码,获得边缘图以及辅助信息;将解码得到的边缘图以及辅助信息输入生成神经网络中,进行网络的前向计算;根据得到的计算结果与对应原始图片进行损失函数计算,并将计算的损失反向传播到神经网络进行网络权值更新直到神经网络收敛,得到双路码流解码器;获取待处理图像的边缘图和辅助信息并编码压缩后得到两路码流;双路码流解码器对收到的码流解码,重建图像。

    一种粗粒度上下文熵编码方法

    公开(公告)号:CN113347422A

    公开(公告)日:2021-09-03

    申请号:CN202110521800.8

    申请日:2021-05-13

    Applicant: 北京大学

    Abstract: 本发明公开了一种粗粒度上下文熵编码方法。本方法为:1)从图像数据集中选取一原始图像并送入神经网络的编码器中进行编码;2)对编码后的张量进行划分;将每一子张量视为一待编码块;3)熵编码网络对每一待编码块进行上下文熵编码,获得待编码块的上下文信息;4)将每一上下文信息送入概率预测网络中,获得对应待编码块所有元素的概率分布参数;5)根据概率分布参数计算张量信息熵;将张量送入解码器,得到解码重建图像并计算失真项损失函数的损失值;6)根据步骤5)所得结果计算率失真损失函数的损失值并反向传播到神经网络各层;7)重复步骤1)‑6)直到神经网络收敛;8)将目标图像送入训练后的神经网络得到目标图像的编码。

    基于深度学习神经网络的环路滤波方法

    公开(公告)号:CN112019854A

    公开(公告)日:2020-12-01

    申请号:CN201910450808.2

    申请日:2019-05-28

    Applicant: 北京大学

    Abstract: 本发明为一种基于深度学习神经网络的环路滤波方法,利用了视频编码中块划分树的信息,进一步提升视频恢复质量。与传统的视频编码器内采用了手工设计的去块效应模块以及样点自适应补偿模块不同,本发明利用了深度卷积神经网络在大量训练数据集上进行学习,从而更准确地学习到从低质量视频到高质量视频的非线性映射。本发明为块与块间增加了连接,从而可以传递未被压缩的特征信息。此外,本发明还利用了视频编码器提供的块划分树中的多层块划分信息,生成多层编码单元均值图,进一步辅助神经网络更好地消除块效应。

    基于深度学习神经网络的环路滤波方法

    公开(公告)号:CN112019854B

    公开(公告)日:2023-01-17

    申请号:CN201910450808.2

    申请日:2019-05-28

    Applicant: 北京大学

    Abstract: 本发明为一种基于深度学习神经网络的环路滤波方法,利用了视频编码中块划分树的信息,进一步提升视频恢复质量。与传统的视频编码器内采用了手工设计的去块效应模块以及样点自适应补偿模块不同,本发明利用了深度卷积神经网络在大量训练数据集上进行学习,从而更准确地学习到从低质量视频到高质量视频的非线性映射。本发明为块与块间增加了连接,从而可以传递未被压缩的特征信息。此外,本发明还利用了视频编码器提供的块划分树中的多层块划分信息,生成多层编码单元均值图,进一步辅助神经网络更好地消除块效应。

    一种极低码率人机协同图像编码训练方法及编解码方法

    公开(公告)号:CN113949880B

    公开(公告)日:2022-10-14

    申请号:CN202111026165.2

    申请日:2021-09-02

    Applicant: 北京大学

    Abstract: 本发明公开了一种极低码率人机协同图像编码训练方法及编解码方法。本方法为:1)利用训练集训练得到一个生成模型;2)对该训练集中的每一图像Ij进行特征提取和流形映射,得到Ij的流形特征;3)使用超先验模型对流形特征构建码率约束和编解码,得到二进制码流和重建后的流形特征;4)根据码率约束对Ij进行紧致损失函数计算;5)对重建后的流形特征进行人眼视觉映射并输入到生成模型中,根据所得人眼视觉重建结果进行损失函数计算;6)将重建后的流形特征输入到机器视觉模型中,根据所得机器视觉预测结果进行损失函数计算;7)将各损失进行加和更新权值;8)重复2)‑7)直到神经网络的损失收敛,得到极低码率人机协同图像编码器。

    一种基于多参考帧的环路滤波方法及电子装置

    公开(公告)号:CN113132729A

    公开(公告)日:2021-07-16

    申请号:CN202010042012.6

    申请日:2020-01-15

    Applicant: 北京大学

    Abstract: 本发明公开了一种基于多参考帧的环路滤波方法及电子装置,其步骤包括:将原始帧送入视频编码器进行编码得到当前帧,并获取所述当前帧的第一参考帧与第二参考帧;计算所述当前帧、所述第一参考帧以及所述第二参考帧两两间的光流集合;将所述当前帧、所述第一参考帧、所述第二参考帧以及所述光流集合送入一深度卷积循环神经网络,得到滤波重建帧。本发明利用空域信息之外,额外使用了时域信息,提出了联合学习机制,提升了参考帧的质量,在不显著提升网络参数量的基础上,获得了更好的编码性能。

    编解码方法和装置
    10.
    发明公开

    公开(公告)号:CN115883831A

    公开(公告)日:2023-03-31

    申请号:CN202110898667.8

    申请日:2021-08-05

    Abstract: 本申请公开了编解码方法和装置,涉及人工智能技术领域,能够提升数据编解码方法的率失真性能。该方法包括:首先获取待编码数据,然后将所述待编码数据输入第一编码网络以得到目标参数;之后根据所述目标参数构建第二编码网络;接着将所述待编码数据输入所述第二编码网络以得到第一特征;最后对所述第一特征进行编码以得到编码码流。

Patent Agency Ranking