基于图字典学习的三维点云编解码方法、压缩方法及装置

    公开(公告)号:CN114708343B

    公开(公告)日:2025-04-25

    申请号:CN202210288552.1

    申请日:2022-03-22

    Abstract: 本发明提供三维点云图字典学习方法以及基于图字典学习的编解码方法、压缩方法及装置,包括:获得N幅训练集点云数据;对点云数据进行体素化处理,获得体素化的训练集点云数据;对训练集点云数据进行体素块划分,选取若干体素块作为训练集,根据训练集构建图字典学习模型;对图字典学习的目标函数进行迭代优化,获得用于三维点云信号的编解码的图字典。本发明有效地利用点云信号之间的空间相关性,渐进最优地去除点云信号之间的冗余性;利用不同层级信号之间的数据相关性由低层级自上而下进行预测编码,有效地提升了3D点云属性信号的压缩效率,有效减少编码开销,灵活地满足实际需求中对不同质量的解码信号的需求,具有可伸缩性。

    一种光场图像编码和解码方法、系统、装置、设备及介质

    公开(公告)号:CN114283214B

    公开(公告)日:2025-03-21

    申请号:CN202111597434.0

    申请日:2021-12-24

    Abstract: 本发明提供一种光场图像编码和解码方法、系统与装置,属于图像处理技术领域。其主要从光场图像采集各个空间位置的关键视角,计算反映视角间关系的邻接矩阵,编码关键视角和邻接矩阵得到二进制码流。本发明压缩部分关键视角,能够大幅度提升压缩率,并且减小解码缓存大小。通过不同视角间的相关性进行图学习,能够基于邻接矩阵保证重构光场图像的质量,提升率‑失真性能。光场图像广泛应用于环境检测、医学成像等应用领域,由于实际场景中采样得到的光场图像数据可以达到很大量级,亟需设计压缩算法减少存储代价,以及降低传输带宽,本发明提出的模块和算法拥有巨大的工业潜力。

    整数实现的图像编码、解码、压缩方法以及系统、终端

    公开(公告)号:CN119211564A

    公开(公告)日:2024-12-27

    申请号:CN202411315044.3

    申请日:2024-09-20

    Abstract: 本公开提供一种整数实现的图像编码、解码、压缩方法以及系统、终端,其中,方法包括:将待压缩图像输入预设的整数化的编码网络,确定整数特征图;将整数特征图输入预设的整数化的超先验编码网络,采用非参数化分布估计确定整数超先验特征图和超先验特征二进制码流;将整数超先验特征图输入预设的整数化的超先验解码网络,确定整数特征图的高斯分布参数;采用预设的熵编码器对整数特征图进行编码处理,确定特征图二进制码流;将超先验特征二进制码流和特征图二进制码流进行合并处理,确定压缩图像二进制码流。通过本公开,在不损失率失真性能的情况下,降低图像编码和图像解码的复杂度,提高图像压缩的运行效率,节省资源消耗。

    基于随机初始化的神经网络压缩、图像分类方法及系统

    公开(公告)号:CN119048799A

    公开(公告)日:2024-11-29

    申请号:CN202411009929.0

    申请日:2024-07-26

    Abstract: 本发明提供一种基于随机初始化的神经网络压缩和图像分类方法及系统,包括:获取待压缩网络及其参数初始化方法和初始化的随机数种子;使用所述随机数种子按照所述初始化方法生成初始化的网络参数;对每一层每个通道搜索缩放因子,将所述初始化的网络参数乘以缩放因子获得缩放的网络参数,使得缩放的网络参数与待压缩的网络参数之间误差的平方和最小;将所述待压缩的网络参数减去所述缩放的网络参数,得到参数差值;对所述参数差值进行压缩处理得到压缩后的参数差值。本发明实现高压缩率,来降低神经网络储存和传输开销,达到节省资源的目的。

    特征图获取方法、系统和三维形状处理方法、终端及介质

    公开(公告)号:CN119027594A

    公开(公告)日:2024-11-26

    申请号:CN202411211527.9

    申请日:2024-08-30

    Abstract: 本发明提供了一种特征图获取方法、系统和三维形状处理方法、终端及介质,包括:获取三维网格数据;对所述三维网格数据预处理,计算获得每个顶点的局部邻域的对数映射、局部邻域中心节点和邻居节点之间的平行传输;将每个顶点的三维坐标、局部邻域的对数映射、局部邻域内中心节点和邻居节点之间的平行传输输入到规范等变胶囊网络,生成特征图;将所述特征图用于三维形状处理。本发明在获得较高性能的同时保证连续SO(2)的规范等变,保证了网络在不同规范、不同三维网格结构、不同顶点位置上的泛化能力,可以用于形状分类、形状分割、球面图像分类等领域,满足几何深度学习三维形状处理的当前需求。

    一种频域特征感知学习的图像编码、解码、压缩方法

    公开(公告)号:CN117354523A

    公开(公告)日:2024-01-05

    申请号:CN202311276043.8

    申请日:2023-09-29

    Abstract: 本发明公开一种频域特征感知学习的图像编码、解码、压缩方法,包括:通过频域特征感知学习模块组成的编码网络获取待编码图像的第一和第二特征图;获取第二特征图的超先验特征二进制码流及超先验信息;将第二特征图划分为多个通道分组;将每个通道分组的分布参化建模为高斯分布,通过基于Transformer的通道自回归熵模型来预测高斯分布的均值、方差;根据高斯分布对第二特征图进行概率估计,并进行算术编码,获得每个通道分组的特征二进制码流并合并为特征二进制码流,与超先验特征二进制码流合并,得到压缩图像二进制码流。本发明可以提取更为紧凑的隐变量,能够精确地对三维特征的分布进行建模和估计码率,提升图像压缩的率失真性能。

    保护用户隐私的联邦学习和图像分类方法、系统及终端

    公开(公告)号:CN111477290B

    公开(公告)日:2023-10-31

    申请号:CN202010151109.0

    申请日:2020-03-05

    Abstract: 本发明提供一种保护用户隐私的联邦学习和图像分类方法、系统及终端,联邦学习方法包括:采集各终端上用户行为产生的数据,保存于该本地终端;服务器发送一个统一的模型给各终端,各终端利用采集到的所述数据训练所述模型;将各终端训练后的所述模型上传到所述服务器,所述服务器对所述模型先在不同终端之间进行交换后再全局聚合,或者,所述服务器对所述模型先进行部分聚合后再在不同终端之间交换,最后进行全局聚合。网络系统包括:本地训练模块、模型通信模块、模型交换模块、模型聚合模块。本发明对各终端数据分布不相同的联邦学习场景能得到比传统方法更好的效果,且保证了整个系统的隐私保护能力,使其能适应各种应用场景。

    一种基于张量网络的熵编码、熵解码方法及图像压缩方法

    公开(公告)号:CN115834914A

    公开(公告)日:2023-03-21

    申请号:CN202211561058.4

    申请日:2022-12-07

    Abstract: 本发明提供一种基于张量网络的熵编码、熵解码方法及图像压缩方法、系统、装置,包括:采用格雷码将图像的离散特征划分为多个二进制位平面;采用特征映射将二进制位平面映射到对应的希尔伯特空间内,生成位平面的向量化特征;基于张量网络的熵编码模型,对位平面的向量化特征分别进行概率估计及编码,生成位平面特征二进制码流;合并所有的位平面特征二进制码流,得到特征二进制码流。采用张量网络建模特征概率分布,能够在不引入任何先验假设的条件下,准确计算特征的联合概率,相比于现有熵模型的设计进一步提升了压缩结构的灵活性和可扩展性。

    一种内窥镜超声影像的处理方法及系统

    公开(公告)号:CN112741651B

    公开(公告)日:2022-11-25

    申请号:CN202011585174.0

    申请日:2020-12-25

    Abstract: 本发明提供一种内窥镜超声影像的处理方法及系统,所述方法包括:获取CP‑EBUS成像技术中三个模式的超声影像,其中,三个模式是指弹性模式E、灰阶模式B和多普勒血流模式F;采用多模态神经网络对三个模式的所述超声影像进行分类,得到识别淋巴结的处理结果。本发明使用CP‑EBUS成像技术中三个模式的图像数据,通过多模态神经网络对这些图像进行处理,能够更为准确的识别超声影像的淋巴结,从而有助于提升淋巴结诊断的准确率。

    基于图字典学习的三维点云编解码方法、压缩方法及装置

    公开(公告)号:CN114708343A

    公开(公告)日:2022-07-05

    申请号:CN202210288552.1

    申请日:2022-03-22

    Abstract: 本发明提供三维点云图字典学习方法以及基于图字典学习的编解码方法、压缩方法及装置,包括:获得N幅训练集点云数据;对点云数据进行体素化处理,获得体素化的训练集点云数据;对训练集点云数据进行体素块划分,选取若干体素块作为训练集,根据训练集构建图字典学习模型;对图字典学习的目标函数进行迭代优化,获得用于三维点云信号的编解码的图字典。本发明有效地利用点云信号之间的空间相关性,渐进最优地去除点云信号之间的冗余性;利用不同层级信号之间的数据相关性由低层级自上而下进行预测编码,有效地提升了3D点云属性信号的压缩效率,有效减少编码开销,灵活地满足实际需求中对不同质量的解码信号的需求,具有可伸缩性。

Patent Agency Ranking