-
公开(公告)号:CN101309421A
公开(公告)日:2008-11-19
申请号:CN200810115414.3
申请日:2008-06-23
Applicant: 北京工业大学
Abstract: 本发明公开了一种帧内预测模式选择方法,包括:计算当前编码块的边方向强度值;根据最小所述边方向强度值所对应的预测模式和直流模式进行帧内预测处理。所述计算当前编码块的边方向强度值具体为:采用4×4像素块、8×8像素块或16×16像素块计算所述当前编码块的边方向强度值。本发明帧内预测模式选择方法通过采用边方向强度值这一边缘特征对预测模式进行选择,只保留具有最小边方向强度值的一个或多个预测模式以及DC模式,在编码性能没有改变的基础上能够有效地降低RDO运算量,缩短运算时间,提高帧内预测效率,从而达到实时编码的效果。
-
公开(公告)号:CN119071494A
公开(公告)日:2024-12-03
申请号:CN202411057952.7
申请日:2024-08-02
Applicant: 北京工业大学
IPC: H04N19/176 , H04N19/96 , H04N19/20
Abstract: 公开一种基于球面深度神经网络的球面图像压缩方法及装置。本发明基于球面测度的球面图像重采样,采用SMSIR对球面图像进行均匀采样,设计球面图像学习的基本组件,通过集成球面卷积和自注意力的球面变换,利用球面熵模型的码率进行建模,因此能够解决传统球面压缩方法效率低的问题。
-
公开(公告)号:CN118864620A
公开(公告)日:2024-10-29
申请号:CN202410820879.8
申请日:2024-06-24
Applicant: 北京工业大学
IPC: G06T9/00 , G06N3/0455 , G06N3/0464 , G06N3/08
Abstract: 公开一种基于球面测度表示和深度学习的球面图像压缩方法及装置,能够解决传统球面压缩方法效率低的问题,同时考虑局部窗口感受野的扩大和局部及非局部相关性的捕捉,提高熵模型的准确性。方法包括:(1)通过基于球面测度的球面图像重采样来均匀采样球面图像;(2)构建球面图像学习的基本组件;(3)集成球面卷积和自注意力的球面transformer,基于球面熵模型的码率建模;其中步骤(2)包括:(2.1)获取球面块;(2.2)进行球面卷积;(2.3)在基于学习的平面图像压缩中,下采样通过步幅大于2的卷积实现;在图像解码过程中,通过上采样来增加图像的分辨率以进行重建;(2.4)建立球面transformer模型。
-
公开(公告)号:CN118379374A
公开(公告)日:2024-07-23
申请号:CN202410292707.8
申请日:2024-03-14
Applicant: 北京工业大学
IPC: G06T11/00 , G06N3/0442 , G06N3/045 , G06N3/0464 , G06N3/084
Abstract: 本发明公开一种基于光谱记忆增强网络的高光谱图像压缩成像方法及装置,对目标函数增加两个先验项来设计重建优化目标,采用半二次分裂的方法来求解优化目标,为局部非局部和低秩先验分别设计了创新的网络模块,充分利用高光谱数据的物理先验知识,以丰富网络的特征表示能力,同时构建基于光谱相关特性的光谱记忆增强网络以减轻不同网络阶段间特征信息的损失。
-
公开(公告)号:CN118368431A
公开(公告)日:2024-07-19
申请号:CN202410306940.7
申请日:2024-03-18
Applicant: 北京工业大学
IPC: H04N19/176 , H04N19/91 , H04N19/124 , H04N19/42 , G06T9/00
Abstract: 一种图稀疏掩膜窗口注意力的学习图像压缩方法及装置,能够关注图像空域像素相关性与窗口注意力机制之间的联系,更好地适用于图像压缩任务,在编码性能相当的情况下,本发明所得到的重建图像在结构相似性客观指标上表现更加出色,主观质量上得到的重建图像纹理细节重建的更好。方法包括:(1)以自然图像为输入,经分块操作后送入编码器,获得能量紧凑的隐变量表示;(2)通过量化和算术编码得到用于传输的比特流;(3)在解码端,比特流依据逐通道自回归熵模型重建得到隐变量表示;(4)该重建隐变量表示经解码器得到最终的重建图像。
-
公开(公告)号:CN118071604A
公开(公告)日:2024-05-24
申请号:CN202410100626.3
申请日:2024-01-24
Applicant: 北京工业大学
IPC: G06T3/4076 , G06T3/4007 , G06V10/44 , G06V10/80 , G06N3/0464 , G06V10/82 , G06T3/4038 , G06N3/048
Abstract: 一种基于双目立体匹配引导的深度图超分辨率方法属于图像处理领域,网络包含三个阶段:视差估计阶段、特征优化阶段、重建阶段。该网络还使用了新提出的视差估计模块和双路多尺度特征交互模块。网络的输入为低分辨率深度图和双目引导彩图,经过视差估计阶段生成视差图,然后通过特征优化阶段细化深度图与视差图的多尺度特征,并进行深度图、视差图的双路多尺度特征交互,最后将生成的多迭代输出融合,进入重建阶段完成最终的深度图重建。该网络提出使用与深度图物理意义一致的高分辨率视差图作为引导,能提供比普通彩色引导图像更准确的高频信息,从而达到更好的深度图超分辨率效果。
-
公开(公告)号:CN117974818A
公开(公告)日:2024-05-03
申请号:CN202410194374.5
申请日:2024-02-21
Applicant: 北京工业大学
IPC: G06T9/40 , G06T9/00 , G06N3/0464 , G06N3/0455 , G06N3/084 , G06V10/80
Abstract: 一种基于空间通道混合上下文模型的点云几何压缩方法属于点云压缩技术领域。本发明设计基于稀疏卷积的特征变换模块,该模块结合稀疏卷积与残差结构用于对特征聚集并增强以提升重建点云质量;为利用空间相关性准确估计概率,本发明设计了空间频率分解模块,该模块将点云划分为多个空间频率分量并建立由低频到高频的空间依赖,实现码率消耗权衡;此外,为联合利用通道间相关性,本发明设计了分组通道上下文模块,该模块基于通道熵对特征通道进行分组,并将基于空间依赖构建的上下文模型嵌入每个通道组中实现码率显著节省。构成点云几何压缩网络,通过率失真损失不断优化以实现高效编码。
-
公开(公告)号:CN116934962A
公开(公告)日:2023-10-24
申请号:CN202310821544.3
申请日:2023-07-06
Applicant: 北京工业大学
Abstract: 本发明提供了一种基于深度学习的点云上采样方法,包括:频率感知的注意力模块,该模块结合图滤波与通道注意力,用于突出高频点的特征;为了更好的保持几何结构与局部细节,本发明设计了集合内与集合间特征聚合模块和结构感知的特征变换模块;一方面通过聚合集合内与集合间特征用来创建每个点完整的局部表示;另一方面结构感知的特征变换模块通过捕获全局几何结构和精细局部细节来提高扩展点特征的质量;此外,为了提高粗输稠密点云的质量,本发明设计了多尺度空间修正单元,该单元利用了注意力特征融合和多尺度注意力;基于目标数值优化初始点云上采样网络,得到点云上采样网络。
-
公开(公告)号:CN116634152A
公开(公告)日:2023-08-22
申请号:CN202310579557.4
申请日:2023-05-23
Applicant: 北京工业大学
IPC: H04N19/146 , H04N19/19
Abstract: 一种基于超先验可变码率图像压缩的精准R‑λ模型码率控制方法属于计算机视觉领域,针对基于超先验可变码率图像压缩框架无法对于单张图像的目标码率给出相应的拉格朗日乘子。本方法为任意图像和任意基于超先验可变码率图像压缩模型建立拉格朗日乘子λ和码率R的关系,提出精准R‑λ模型。通过3次编码拟合单张图像的精准R‑λ模型。计算出对应目标码率应该输入的拉格朗日乘子。最后对于该图像的任意输入码率,都可以输出与输入码率相近的输出码率,平均误差控制在0.6%下,实现精准的码率控制。
-
公开(公告)号:CN115914638A
公开(公告)日:2023-04-04
申请号:CN202211530532.7
申请日:2022-12-01
Applicant: 北京工业大学
IPC: H04N19/30 , H04N19/146 , H04N19/154 , G06T9/00
Abstract: 一种基于结构和纹理合成的概念图像压缩方法属于计算机视觉领域,本发明所提的压缩框架允许将图像编码为紧凑的、高级可解释的表示来进行重建。利用图像处理技术,将原图转换为保边平滑的结构图,得到图像的结构层,提供图像的结构信息;从原图中心提取的纹理块作为图像的纹理层,提供图像的局部详细纹理信息。将图像的结构层和纹理层进行下采样,结合BPG编码器实现了图像的极致压缩,并用超分辨率模型进行上采样与生成模型保证重建质量。
-
-
-
-
-
-
-
-
-