Patent search ap:("北京大学") AND inv:"王德昭" Page 1

1.

发明授权
基于视觉自注意力网络的视频块级率失真优化方法及系统有权

公开(公告)号：CN115278249B

公开(公告)日：2024-06-28

申请号：CN202210735183.6

申请日：2022-06-27

Applicant: 北京大学

Inventor： 刘家瑛 , 李书家 , 王德昭 , 黄浩峰 , 郭宗明

IPC: H04N19/147 , H04N19/176 , H04N19/42 , G06N3/0464 , G06N3/08

Abstract: 本发明公开一种基于视觉自注意力网络的视频块级率失真优化方法及系统，属于数字视频增强领域，将多头自注意力机制引入视频压缩后处理任务中，充分利用自注意力机制强大的建模能力学习受损帧到无损帧的映射，并构建3种基于视觉自注意力网络的后处理模型，引入多种网络架构针对不同内容进行块级率失真优化，从而高效消除视频在解码重建时产生的伪影和压缩噪声。

2.

发明公开
一种可扩展人机协同图像编码方法及编码系统有权

公开(公告)号：CN113132755A

公开(公告)日：2021-07-16

申请号：CN201911415561.7

申请日：2019-12-31

Applicant: 北京大学

Inventor： 刘家瑛 , 胡越予 , 杨帅 , 王德昭 , 郭宗明

IPC: H04N21/2343 , H04N21/4402 , H04N19/132 , H04N19/13

Abstract: 本发明公开了一种可扩展人机协同图像编码方法及编码系统。本方法为：提取各样本图片的边缘图并矢量化，作为驱动机器视觉任务的紧凑表示；在矢量化后的边缘图中进行关键点提取作为辅助信息；对紧凑表示和辅助信息分别进行熵编码无损压缩，获得两路码流；对两路码流进行初步解码，获得边缘图以及辅助信息；将解码得到的边缘图以及辅助信息输入生成神经网络中，进行网络的前向计算；根据得到的计算结果与对应原始图片进行损失函数计算，并将计算的损失反向传播到神经网络进行网络权值更新直到神经网络收敛，得到双路码流解码器；获取待处理图像的边缘图和辅助信息并编码压缩后得到两路码流；双路码流解码器对收到的码流解码，重建图像。

3.

发明授权
一种粗粒度上下文熵编码方法有权

公开(公告)号：CN113347422B

公开(公告)日：2022-07-12

申请号：CN202110521800.8

申请日：2021-05-13

Applicant: 北京大学

Inventor： 刘家瑛 , 王德昭 , 胡越予 , 郭宗明

IPC: H04N19/13 , H04N19/176 , H04N19/50

Abstract: 本发明公开了一种粗粒度上下文熵编码方法。本方法为：1)从图像数据集中选取一原始图像并送入神经网络的编码器中进行编码；2)对编码后的张量进行划分；将每一子张量视为一待编码块；3)熵编码网络对每一待编码块进行上下文熵编码，获得待编码块的上下文信息；4)将每一上下文信息送入概率预测网络中，获得对应待编码块所有元素的概率分布参数；5)根据概率分布参数计算张量信息熵；将张量送入解码器，得到解码重建图像并计算失真项损失函数的损失值；6)根据步骤5)所得结果计算率失真损失函数的损失值并反向传播到神经网络各层；7)重复步骤1)‑6)直到神经网络收敛；8)将目标图像送入训练后的神经网络得到目标图像的编码。

4.

发明授权
可扩展人机协同图像编码方法及系统、解码器训练方法有权

公开(公告)号：CN113132755B

公开(公告)日：2022-04-01

申请号：CN201911415561.7

申请日：2019-12-31

Applicant: 北京大学

Inventor： 刘家瑛 , 胡越予 , 杨帅 , 王德昭 , 郭宗明

IPC: H04N21/2343 , H04N21/4402 , H04N19/132 , H04N19/13

Abstract: 本发明公开了一种可扩展人机协同图像编码方法及编码系统。本方法为：提取各样本图片的边缘图并矢量化，作为驱动机器视觉任务的紧凑表示；在矢量化后的边缘图中进行关键点提取作为辅助信息；对紧凑表示和辅助信息分别进行熵编码无损压缩，获得两路码流；对两路码流进行初步解码，获得边缘图以及辅助信息；将解码得到的边缘图以及辅助信息输入生成神经网络中，进行网络的前向计算；根据得到的计算结果与对应原始图片进行损失函数计算，并将计算的损失反向传播到神经网络进行网络权值更新直到神经网络收敛，得到双路码流解码器；获取待处理图像的边缘图和辅助信息并编码压缩后得到两路码流；双路码流解码器对收到的码流解码，重建图像。

5.

发明公开
一种粗粒度上下文熵编码方法有权

公开(公告)号：CN113347422A

公开(公告)日：2021-09-03

申请号：CN202110521800.8

申请日：2021-05-13

Applicant: 北京大学

Inventor： 刘家瑛 , 王德昭 , 胡越予 , 郭宗明

IPC: H04N19/13 , H04N19/176 , H04N19/50

Abstract: 本发明公开了一种粗粒度上下文熵编码方法。本方法为：1)从图像数据集中选取一原始图像并送入神经网络的编码器中进行编码；2)对编码后的张量进行划分；将每一子张量视为一待编码块；3)熵编码网络对每一待编码块进行上下文熵编码，获得待编码块的上下文信息；4)将每一上下文信息送入概率预测网络中，获得对应待编码块所有元素的概率分布参数；5)根据概率分布参数计算张量信息熵；将张量送入解码器，得到解码重建图像并计算失真项损失函数的损失值；6)根据步骤5)所得结果计算率失真损失函数的损失值并反向传播到神经网络各层；7)重复步骤1)‑6)直到神经网络收敛；8)将目标图像送入训练后的神经网络得到目标图像的编码。

6.

发明公开
基于深度学习神经网络的环路滤波方法有权

公开(公告)号：CN112019854A

公开(公告)日：2020-12-01

申请号：CN201910450808.2

申请日：2019-05-28

Applicant: 北京大学

Inventor： 刘家瑛 , 王德昭 , 夏思烽 , 杨文瀚 , 胡越予 , 郭宗明

IPC: H04N19/176 , H04N19/149 , H04N19/30 , H04N19/96 , H04N19/82

Abstract: 本发明为一种基于深度学习神经网络的环路滤波方法，利用了视频编码中块划分树的信息，进一步提升视频恢复质量。与传统的视频编码器内采用了手工设计的去块效应模块以及样点自适应补偿模块不同，本发明利用了深度卷积神经网络在大量训练数据集上进行学习，从而更准确地学习到从低质量视频到高质量视频的非线性映射。本发明为块与块间增加了连接，从而可以传递未被压缩的特征信息。此外，本发明还利用了视频编码器提供的块划分树中的多层块划分信息，生成多层编码单元均值图，进一步辅助神经网络更好地消除块效应。

7.

发明授权
基于深度学习神经网络的环路滤波方法有权

公开(公告)号：CN112019854B

公开(公告)日：2023-01-17

申请号：CN201910450808.2

申请日：2019-05-28

Applicant: 北京大学

Inventor： 刘家瑛 , 王德昭 , 夏思烽 , 杨文瀚 , 胡越予 , 郭宗明

IPC: H04N19/176 , H04N19/149 , H04N19/30 , H04N19/96 , H04N19/82

Abstract: 本发明为一种基于深度学习神经网络的环路滤波方法，利用了视频编码中块划分树的信息，进一步提升视频恢复质量。与传统的视频编码器内采用了手工设计的去块效应模块以及样点自适应补偿模块不同，本发明利用了深度卷积神经网络在大量训练数据集上进行学习，从而更准确地学习到从低质量视频到高质量视频的非线性映射。本发明为块与块间增加了连接，从而可以传递未被压缩的特征信息。此外，本发明还利用了视频编码器提供的块划分树中的多层块划分信息，生成多层编码单元均值图，进一步辅助神经网络更好地消除块效应。

8.

发明授权
一种极低码率人机协同图像编码训练方法及编解码方法有权

公开(公告)号：CN113949880B

公开(公告)日：2022-10-14

申请号：CN202111026165.2

申请日：2021-09-02

Applicant: 北京大学

Inventor： 刘家瑛 , 杨文瀚 , 黄浩峰 , 王德昭 , 段凌宇

IPC: H04N19/42 , G06N3/04 , G06N3/08

Abstract: 本发明公开了一种极低码率人机协同图像编码训练方法及编解码方法。本方法为：1)利用训练集训练得到一个生成模型；2)对该训练集中的每一图像Ij进行特征提取和流形映射，得到Ij的流形特征；3)使用超先验模型对流形特征构建码率约束和编解码，得到二进制码流和重建后的流形特征；4)根据码率约束对Ij进行紧致损失函数计算；5)对重建后的流形特征进行人眼视觉映射并输入到生成模型中，根据所得人眼视觉重建结果进行损失函数计算；6)将重建后的流形特征输入到机器视觉模型中，根据所得机器视觉预测结果进行损失函数计算；7)将各损失进行加和更新权值；8)重复2)‑7)直到神经网络的损失收敛，得到极低码率人机协同图像编码器。

9.

发明公开
一种基于多参考帧的环路滤波方法及电子装置有权

公开(公告)号：CN113132729A

公开(公告)日：2021-07-16

申请号：CN202010042012.6

申请日：2020-01-15

Applicant: 北京大学

Inventor： 刘家瑛 , 王德昭 , 夏思 , 杨文瀚 , 郭宗明

IPC: H04N19/139 , H04N19/82 , G06N3/04

Abstract: 本发明公开了一种基于多参考帧的环路滤波方法及电子装置，其步骤包括：将原始帧送入视频编码器进行编码得到当前帧，并获取所述当前帧的第一参考帧与第二参考帧；计算所述当前帧、所述第一参考帧以及所述第二参考帧两两间的光流集合；将所述当前帧、所述第一参考帧、所述第二参考帧以及所述光流集合送入一深度卷积循环神经网络，得到滤波重建帧。本发明利用空域信息之外，额外使用了时域信息，提出了联合学习机制，提升了参考帧的质量，在不显著提升网络参数量的基础上，获得了更好的编码性能。

10.

发明公开
编解码方法和装置审中-实审

公开(公告)号：CN115883831A

公开(公告)日：2023-03-31

申请号：CN202110898667.8

申请日：2021-08-05

Applicant: 华为技术有限公司 , 北京大学

Inventor： 刘家瑛 , 王德昭 , 王晶 , 郭天生 , 崔泽 , 葛运英

IPC: H04N19/147 , H04N19/85

Abstract: 本申请公开了编解码方法和装置，涉及人工智能技术领域，能够提升数据编解码方法的率失真性能。该方法包括：首先获取待编码数据，然后将所述待编码数据输入第一编码网络以得到目标参数；之后根据所述目标参数构建第二编码网络；接着将所述待编码数据输入所述第二编码网络以得到第一特征；最后对所述第一特征进行编码以得到编码码流。

Search Results

Country/Region

Patent validity

Application date

Publication (announcement) day

applicant

The country/region where the applicant is located

Inventor

IPC

IPC Department

IPC class

IPC subclass

IPC group

IPC team

Appearance classification