一种深度特征压缩方法
    73.
    发明授权

    公开(公告)号:CN113537456B

    公开(公告)日:2023-10-17

    申请号:CN202110660867.X

    申请日:2021-06-15

    Applicant: 北京大学

    Abstract: 本发明公开了一种深度特征压缩方法,本发明构建并训练一压缩模型,该模型首先对神经网络提取的图像特征表示进行变换,产生变换后的紧凑表示,提取变换后的表示的超先验码流;超先验码流用于产生码本各个基元素的线性组合系数;码本从特征中学习获得;根据线性组合系数和对应的码本产生超先验概率估计,从而使用熵编码器进行熵编码,产生码流;码流通过熵解码和解码变换产生输出的特征表示。本发明能够对深度特征进行有效压缩,而且能够对多个任务特征进行协同压缩,重建时,对特征进行分离操作,分别产生对应不同任务的重建特征;本发明还能够支持训练时未见的新任务。

    可伸缩机器视觉编码方法和运动引导图像生成网络的训练方法

    公开(公告)号:CN113132727B

    公开(公告)日:2022-07-22

    申请号:CN201911393847.X

    申请日:2019-12-30

    Applicant: 北京大学

    Abstract: 本发明公开了一种基于图像生成的可伸缩机器视觉编码方法,其步骤包括:构建一运动引导图像生成网络;训练神经网络:每次迭代时,从视频序列中选取关键帧与待编码帧及对应的关键点数据并输入网络,计算出关键帧和待编码帧的关键点;根据关键帧与待编码帧的关键点差别进行运动估计;根据估计所得运动以及关键帧获得待编码帧的重建帧;计算关键点位置的预测结果与关键点实际位置之间的预测误差以及计算待编码帧与其重建帧的重建误差,并将其反向传播到网络直到网络收敛;编码阶段:将待处理视频序列的每一帧输入训练后的运动引导图像生成网络,计算每一帧中的关键点的位置信息并进行量化压缩;解码阶段根据码流和任务进行图像重建。

    一种基于视网膜大脑皮层理论的深度学习低光照图像增强方法

    公开(公告)号:CN110796607B

    公开(公告)日:2022-07-22

    申请号:CN201810876683.5

    申请日:2018-08-03

    Applicant: 北京大学

    Abstract: 本发明公开了一种基于视网膜大脑皮层理论的深度学习低光照图像增强方法,其步骤包括:通过一个分解网络将待提亮低光照图片分解成本质和光照,在本质上进行噪声去除,将光照和本质输入一个提亮网络得到提亮后的光照,将提亮后的光照和去除噪声后的本质相乘得到最后的正常光照图片。本发明能够端对端地学习提亮低光照图像,通过机器学习方法能够取得更为精确的光照本质分解和更自然适用范围更广的提亮结果。

    一种粗粒度上下文熵编码方法

    公开(公告)号:CN113347422B

    公开(公告)日:2022-07-12

    申请号:CN202110521800.8

    申请日:2021-05-13

    Applicant: 北京大学

    Abstract: 本发明公开了一种粗粒度上下文熵编码方法。本方法为:1)从图像数据集中选取一原始图像并送入神经网络的编码器中进行编码;2)对编码后的张量进行划分;将每一子张量视为一待编码块;3)熵编码网络对每一待编码块进行上下文熵编码,获得待编码块的上下文信息;4)将每一上下文信息送入概率预测网络中,获得对应待编码块所有元素的概率分布参数;5)根据概率分布参数计算张量信息熵;将张量送入解码器,得到解码重建图像并计算失真项损失函数的损失值;6)根据步骤5)所得结果计算率失真损失函数的损失值并反向传播到神经网络各层;7)重复步骤1)‑6)直到神经网络收敛;8)将目标图像送入训练后的神经网络得到目标图像的编码。

    可扩展人机协同图像编码方法及系统、解码器训练方法

    公开(公告)号:CN113132755B

    公开(公告)日:2022-04-01

    申请号:CN201911415561.7

    申请日:2019-12-31

    Applicant: 北京大学

    Abstract: 本发明公开了一种可扩展人机协同图像编码方法及编码系统。本方法为:提取各样本图片的边缘图并矢量化,作为驱动机器视觉任务的紧凑表示;在矢量化后的边缘图中进行关键点提取作为辅助信息;对紧凑表示和辅助信息分别进行熵编码无损压缩,获得两路码流;对两路码流进行初步解码,获得边缘图以及辅助信息;将解码得到的边缘图以及辅助信息输入生成神经网络中,进行网络的前向计算;根据得到的计算结果与对应原始图片进行损失函数计算,并将计算的损失反向传播到神经网络进行网络权值更新直到神经网络收敛,得到双路码流解码器;获取待处理图像的边缘图和辅助信息并编码压缩后得到两路码流;双路码流解码器对收到的码流解码,重建图像。

    一种粗粒度上下文熵编码方法

    公开(公告)号:CN113347422A

    公开(公告)日:2021-09-03

    申请号:CN202110521800.8

    申请日:2021-05-13

    Applicant: 北京大学

    Abstract: 本发明公开了一种粗粒度上下文熵编码方法。本方法为:1)从图像数据集中选取一原始图像并送入神经网络的编码器中进行编码;2)对编码后的张量进行划分;将每一子张量视为一待编码块;3)熵编码网络对每一待编码块进行上下文熵编码,获得待编码块的上下文信息;4)将每一上下文信息送入概率预测网络中,获得对应待编码块所有元素的概率分布参数;5)根据概率分布参数计算张量信息熵;将张量送入解码器,得到解码重建图像并计算失真项损失函数的损失值;6)根据步骤5)所得结果计算率失真损失函数的损失值并反向传播到神经网络各层;7)重复步骤1)‑6)直到神经网络收敛;8)将目标图像送入训练后的神经网络得到目标图像的编码。

Patent Agency Ranking