-
公开(公告)号:CN104735450A
公开(公告)日:2015-06-24
申请号:CN201510088867.1
申请日:2015-02-26
Applicant: 北京大学
IPC: H04N19/147 , H04N19/117 , H04N19/186 , H04N19/80 , H04N19/82
Abstract: 本发明涉及一种在视频编解码中进行自适应环路滤波的方法及装置以及对应的视频编解码系统,所述方法包括:在编码端求解出当前图像的滤波系数,根据所述滤波系数对当前图像的各颜色分量进行滤波,并得到各颜色分量的帧级滤波控制开关和LCU级滤波控制开关;以及在解码端根据各颜色分量的帧级滤波控制开关及对应的滤波系数,进行滤波系数重构,并根据得到的LCU级滤波控制开关,选择性地采用重构后的滤波系数对LCU中的每个像素进行滤波。本发明有效地提高了编码效率,同时使得计算复杂度和硬件实现复杂度降低在可接受范围内,符合实际应用的需求,减少了失真信号与原始信号之间误差,提高当前图像质量,进而提供高质量参考预测图像。
-
-
公开(公告)号:CN116137050A
公开(公告)日:2023-05-19
申请号:CN202310416460.1
申请日:2023-04-19
Applicant: 北京大学
Abstract: 本申请公开了一种三维真人模型处理方法、处理装置、电子设备及存储介质。该三维真人模型处理方法,包括:将输入的三维真人模型划分为粗粒度层和细粒度层;基于原始参数化真人模型SMPL、所述粗粒度层和所述细粒度层,获取与所述输入的三维真人模型相对应的编码数据;根据所述编码数据在解码端重建并输出三维真人模型。本申请实施例提供的三维真人模型处理方法,提高了三维真人模型传输后的视觉质量,能够在保证视觉感知效果的基础上极大节省三维真人模型传输过程中的码率。
-
公开(公告)号:CN111901595B
公开(公告)日:2021-07-20
申请号:CN202010603341.3
申请日:2020-06-29
Applicant: 北京大学
IPC: H04N19/124 , H04N19/154 , H04N19/177 , H04N19/42 , G06K9/00
Abstract: 本发明公开了一种基于深度神经网络的视频编码方法及装置、介质,该编码方法包括:对待编码帧序列中的第一设定帧图像进行编码,以得到初始编码结果;对待编码帧序列进行像素级分割,以得到分割掩膜序列;根据分割掩膜序列对第二设定帧图像进行编码,以得到图像重构结果;再利用图像重构结果中的分割掩膜所在区域的像素生成像素级的视频帧;可通过图像分割方式将像素级的视频帧与初始编码结果进行像素级图像融合。该编码装置包括初始编码模块、分割网络模块、结果重构模块、生成网络模块及图像融合模块。区别于主流的基于块的混合视频编码框架,本发明基于像素级别图像的分析与合成,能够显著提高对视频中非刚性运动内容的重构质量。
-
公开(公告)号:CN104702963B
公开(公告)日:2017-11-24
申请号:CN201510080866.2
申请日:2015-02-13
Applicant: 北京大学
IPC: H04N19/82 , H04N19/186
Abstract: 本发明公开了一种自适应环路滤波的边界处理方法及装置,所述边界处理方法包括:根据序列的当前最大编码单元的上边界和下边界,确定滤波区域;以及确定所述滤波区域的左边界外和右边界外的像素是否可用,且在自适应环路滤波ALF过程中,对于不可用的像素样本,使用所述滤波区域内距离该像素样本最近的像素样本代替。本发明解决了ALF滤波过程中的边界处理问题,充分利用了像素之间的相关性,以微小的编码性能损失为代价,降低了自适应环路滤波器实现过程中的硬件成本。
-
公开(公告)号:CN102136144A
公开(公告)日:2011-07-27
申请号:CN201110089697.0
申请日:2011-04-11
Applicant: 北京大学
Abstract: 本发明公布了一种图像配准可靠性模型及其构造方法和一种基于该模型的超分辨率图像的重构方法。本发明提供的图像配准可靠性模型,利用图像配准残差在不同尺度下的分布特征和图像局部结构信息来表示每个像素配准可靠性。超分辨率图像的重构方法:利用核回归的预测模型,根据低分辨率图像结构特性和低分辨率图像间的运动关系,根据图像内容和运动特性自适应的3维核函数用来估计高分辨率像素值。本发明不仅能够对运动平滑的低分辨率图像进行超分辨率重构,同时也可以对运动剧烈的低分辨率图像进行有效的超分辨率重构,提高了超分辨率技术的鲁棒性,适合实际应用。
-
公开(公告)号:CN119336157A
公开(公告)日:2025-01-21
申请号:CN202411272324.0
申请日:2024-09-11
Applicant: 北京大学
IPC: G06F3/01 , G06F3/04815 , G06F3/14
Abstract: 本申请公开了一种交互式三维显示系统和方法,该系统包括:服务器、显示模块以及交互装置;服务器分别与显示模块以及交互装置通信连接;交互装置,用于根据用户的手势,发送交互请求至服务器;服务器,接收交互装置发送的交互请求,基于交互请求与预设多屏拼接模型,调整显示模块上显示的内容;预设多屏拼接模型用于计算用户为获得最佳视觉效果所需的目标观察距离。本申请提供了一种预设多屏拼接模型,该模型用于计算用户为获得最佳视觉效果所需的目标观察距离,因此当显示屏更换或参数调整后,通过该模型可以重新计算最佳视觉效果所需的目标观察距离作为内容调整的基础参数,使得用户不会由于角度变化引起视觉错位,提升了观看的连贯性和舒适度。
-
公开(公告)号:CN119225530A
公开(公告)日:2024-12-31
申请号:CN202411208770.5
申请日:2024-08-30
Applicant: 北京大学
IPC: G06F3/01 , G06F3/04815 , G06T17/00 , G06T15/00 , G06T19/20
Abstract: 本申请公开了一种人机交互方法、装置、介质及电子设备,方法包括:响应于用户针对目标对象的选择指令,展示目标对象的数字3D模型;在数字3D模型的展示时长到达预设时长的情况下,获取目标对象的介绍文本;根据介绍文本,通过多模态大模型对数字3D模型进行推理,得到与介绍文本相关的分割区域,多模态大模型用于将介绍文本与多个视角的2D图像进行对齐并分割,多个视角的2D图像是将数字3D模型的不同预定义视点进行渲染得到的;播放介绍文本对应的音频,并显示分割区域。因此,采用本申请实施例,用户在面对文化遗产的数字化展示时,可以将抽象的文本解释与具体的文化细节有效联系起来,从而提升了用户的体验和学习效果。
-
公开(公告)号:CN111901673B
公开(公告)日:2021-12-03
申请号:CN202010590741.5
申请日:2020-06-24
Applicant: 北京大学
IPC: H04N21/44
Abstract: 本发明公开了一种视频预测方法、装置、存储介质及终端,所述方法包括:根据时空信息、时域信息和空域信息生成并输出第一视频当前时刻的第一输出信息;通过视频解码器对第一输出信息进行解码并预测出当前时刻的视频预测片段;对预测出的各个时刻的视频预测片段进行拼接,得到并输出具有第二预设帧数的第二视频,第二视频为第一视频的预测视频、且第一预设帧数小于第二预设帧数,因此,采用本申请实施例,由于能够根据获取的具有第一预设帧数的第一视频,预测出具有第二预设帧数的第二视频,这样,无需在内存中存储第一视频的完整视频,提升了视频的加载速度,加载视频无需等待,提高了用户体验度。
-
公开(公告)号:CN111898750A
公开(公告)日:2020-11-06
申请号:CN202010603853.X
申请日:2020-06-29
Applicant: 北京大学
Abstract: 本发明公开了一种基于进化算法的神经网络模型压缩方法,包括:随机生成各个网络层的权值精度和激活值精度,得到不同的量化策略;根据所述权值精度和激活值精度计算不同量化策略的适应度;根据所述适应度计算得到进化中的最优量化策略;根据所述最优量化策略对神经网络的权值和激活值进行量化,实现神经网络模型压缩。本发明公开的神经网络模型压缩方法,可以针对不同的网络层实行不同程度的权值量化,还可以对权值和激活值进行联合优化,使模型性能达到最优,而且基于进化算法可以自动搜索最优量化策略,不需要人为经验和其他规则约束。
-
-
-
-
-
-
-
-
-