-
公开(公告)号:CN113473135B
公开(公告)日:2023-09-01
申请号:CN202110577503.5
申请日:2021-05-26
Applicant: 北京大学
IPC: H04N19/159 , H04N19/182
Abstract: 本公开涉及一种面向非线性纹理的帧内预测方法、设备及介质,所述方法用于图像、视频编码领域的帧内预测模块中,所述方法包括:确定当前的帧内预测模式;在所述帧内预测模块中使用包含二次函数的预测建模预测非线性纹理;根据预测非线性纹理的结果导出参考像素的位置,并根据参考像素插值产生预测像素值。本公开解决了图像、视频编解码标准帧内预测模块面向非线性纹理内容的高效预测建模问题。本公开可以生成与原始信号接近的高保真的预测信号,减少预测残差,提升编码效率。
-
公开(公告)号:CN113473135A
公开(公告)日:2021-10-01
申请号:CN202110577503.5
申请日:2021-05-26
Applicant: 北京大学
IPC: H04N19/159 , H04N19/182
Abstract: 本公开涉及一种面向非线性纹理的帧内预测方法、设备及介质,所述方法用于图像、视频编码领域的帧内预测模块中,所述方法包括:确定当前的帧内预测模式;在所述帧内预测模块中使用包含二次函数的预测建模预测非线性纹理;根据预测非线性纹理的结果导出参考像素的位置,并根据参考像素插值产生预测像素值。本公开解决了图像、视频编解码标准帧内预测模块面向非线性纹理内容的高效预测建模问题。本公开可以生成与原始信号接近的高保真的预测信号,减少预测残差,提升编码效率。
-
公开(公告)号:CN110415176A
公开(公告)日:2019-11-05
申请号:CN201910732571.7
申请日:2019-08-09
Applicant: 北京大学深圳研究生院
Abstract: 本发明提供了一种文本图像超分辨率方法,包括:先使用深度抠图技术将低分辨率图像分解成前景图层、背景图层、alpha图层;然后,对于alpha图层,先用Teager滤波对其进行预处理,再将其送入深度空域特征转换生成对抗网络(SFTGAN)进行超分辨率操作;对于前景图层和背景图层,将其直接送入增强超分生成对抗网络(ESRGAN)进行超分辨率操作;最后,将三层超分后得到得高分辨率图像进行融合,即得到高清图像。本发明的文本图像超分辨率方法,对于低分辨率文本图像,能够较好的将其转化成高分辨率图像,可以作为图像预处理中的超分辨率过程应用到多种机器视觉领域。
-
公开(公告)号:CN108830212A
公开(公告)日:2018-11-16
申请号:CN201810597905.X
申请日:2018-06-12
Applicant: 北京大学深圳研究生院
Abstract: 本发明公布了一种视频行为时间轴检测方法,基于深度学习和时间结构建模,并结合粗粒度检测与细粒度检测做视频行为时间轴检测,在已有模型SSN的基础上,使用双流模型来提取视频的时空特征;对行为的时间结构进行建模,将单个行为分为三个阶段;接着提出一种新的能够有效提取视频行为的时间边界信息的特征金字塔;最后结合粗粒度检测与细粒度检测,使得检测结果更加精确;本发明的检测精度高,超过了当前已有的所有公开方法,具有广泛的适用性,可适用于智能监控系统或者人机监护系统中对人类感兴趣视频片段的检测,便于后续的分析与处理,具有重要的应用价值。
-
公开(公告)号:CN105954279A
公开(公告)日:2016-09-21
申请号:CN201610463174.0
申请日:2016-06-23
Applicant: 北京大学第三医院 , 北京望升伟业科技发展有限公司
IPC: G01N21/78
CPC classification number: G01N21/78
Abstract: 本发明公开了一种尿液氯化钠快速检测试剂盒,包括标准比色卡,试纸条,取尿杯,塑料吸管和帆布小包,所述的标准比色卡包括两个长方形色块和固定硬卡纸,每个色块中央有一个圆形判断孔,每个圆形判断孔的直径为5‑8mm。所述的两个长方形色块的尺寸为长40±2mm,宽20±1mm,两个正方形色块的一侧用双面不干胶粘贴固定在硬卡纸上。标准比色卡二个长方形色块的颜色分别为红褐色和橙黄色。试纸条有7种,分别对应是6克/升,8克/升,10克/升,12克/升,14克/升,16克/升,18克/升。优点是:方法简单、便捷快速,试纸条的成本低廉,非常适用于百姓的家庭中自己检测尿中的氯化钠的浓度,为高血压等心血管疾病的预防和治疗提供了一种新方法。
-
公开(公告)号:CN115834905A
公开(公告)日:2023-03-21
申请号:CN202310089995.2
申请日:2023-02-09
Applicant: 北京大学 , 咪咕文化科技有限公司
IPC: H04N19/503
Abstract: 本申请公开了一种帧间预测的方法、装置、电子设备及介质。本申请中,将参考帧输入到预设的第一时序学习模型中,推理一段时间内时空域的变化规律,并依据此导出初始预测信号;获取参考帧与待编码帧的高维特征,并将高维特征与初始预测信号融合到预设的第二时序学习模型中,得到扩展运动信息;基于扩展运动信息,对初始预测信号调整和增强。通过应用本申请的技术方案,可以实现一种利用第一时序学习模型提取用于表征若干个相邻的参考帧在时空域的变化规律的时域转换特征,导出内在运动信息,并利用第二序学习模型,学习扩展运动信息并以此得到预测帧。从而达到避免相关技术中出现的,采用固有的运动信息进行帧间预测会导致帧间预测的效果不佳的问题。
-
公开(公告)号:CN111901592B
公开(公告)日:2023-01-17
申请号:CN202010613236.8
申请日:2020-06-30
Applicant: 北京大学
IPC: H04N19/107 , H04N19/124 , H04N19/176 , H04N19/186 , G06N3/08
Abstract: 本申请公开了一种预测编码神经网络权重更新方法、装置及介质。本申请适用于基于神经网络的预测编码工具,包括帧内预测、帧间预测、以及预测后的增强等。由于视频前后帧存在的连续性,导致已编码帧与待处理帧在场景、纹理、内容的分布上存在着极高的相似性,因此在已编码数据中挖掘相关信息来调整网络参数可以使得神经网络定制化,十分有利于后续编码过程。另一方面,重构像素在编解码端都易获取,相比于预测像素,重构像素的客观质量更接近于原始像素,因此可以作为标签来反向微调神经网络的参数。
-
公开(公告)号:CN111372084B
公开(公告)日:2021-07-20
申请号:CN202010100106.4
申请日:2020-02-18
Applicant: 北京大学
IPC: H04N19/436 , H04N19/176 , H04N19/147 , H04N19/14 , H04N19/70 , H04N19/82 , G06N3/04 , G06N3/08
Abstract: 本发明公开了一种面向神经网络编解码工具的并行推理方法,包括:对待处理的图像进行边界扩充,得到边界完整的图像;根据光栅扫描顺序将所述边界完整的图像划分成大小相同的图像块;将所述大小相同的图像块组织成若干个张量,并将所述若干个张量作为一组张量同时送入神经网络中进行前向传播处理,其中,根据神经网络编码工具以及硬件显存大小设置所述张量的批尺寸值。通过上述方法,可以有效减少神经网络推理时的显存,降低神经网络视频编码工具的编解码复杂度。
-
公开(公告)号:CN111901592A
公开(公告)日:2020-11-06
申请号:CN202010613236.8
申请日:2020-06-30
Applicant: 北京大学
IPC: H04N19/107 , H04N19/124 , H04N19/176 , H04N19/186 , G06N3/08
Abstract: 本申请公开了一种预测编码神经网络权重更新方法、装置及介质。本申请适用于基于神经网络的预测编码工具,包括帧内预测、帧间预测、以及预测后的增强等。由于视频前后帧存在的连续性,导致已编码帧与待处理帧在场景、纹理、内容的分布上存在着极高的相似性,因此在已编码数据中挖掘相关信息来调整网络参数可以使得神经网络定制化,十分有利于后续编码过程。另一方面,重构像素在编解码端都易获取,相比于预测像素,重构像素的客观质量更接近于原始像素,因此可以作为标签来反向微调神经网络的参数。
-
公开(公告)号:CN110490823A
公开(公告)日:2019-11-22
申请号:CN201910747855.3
申请日:2019-08-14
Applicant: 北京大学深圳研究生院
IPC: G06T5/00
Abstract: 本发明提供了一种真实环境下的图像去噪方法,包括使用连拍多张并位置矫正生成训练集,再使用域自适应扩充该训练集,最后通过将此训练集用于训练一个噪声注意力生成对抗网络,以此达到对真实环境下的噪声去噪。本发明的方法能够在真实环境未知图像噪声类型的情况下,精确地去除图像中的噪声,作为图像预处理中的去噪过程应用到多种机器视觉领域,特别地,本发明提供了对常用公开测试集的去噪实施实例。
-
-
-
-
-
-
-
-
-