用于自动编码器的帧间译码变换
    1.
    发明公开

    公开(公告)号:CN119906830A

    公开(公告)日:2025-04-29

    申请号:CN202411491313.1

    申请日:2024-10-24

    Abstract: 本公开提供用于视频译码的方法、装置以及系统。本实现方式更具体地涉及支持潜在域中的帧之间译码的自动编码器。视频编码器可以基于机器学习模型来将视频帧从像素域转换到潜在域。例如,机器学习模型可以被训练成将视频帧变换成潜在属性张量。在一些方面中,视频编码器可以将所产生张量和与先前编码的视频帧相关联的潜在属性张量组合并且基于帧间译码变换来将所产生张量变换成包括来自当前视频帧和先前视频帧两者的潜在属性的向量。更具体地,帧间译码变换可以降低组合的张量的维度,使得所产生向量比原始潜在属性张量更小或更可压缩。

    借助于图块大小选择减少图像缩放伪像

    公开(公告)号:CN118057816A

    公开(公告)日:2024-05-21

    申请号:CN202311545829.5

    申请日:2023-11-20

    Abstract: 本公开提供了用于图像缩放的方法、设备和系统。本实现方式更具体地涉及保留数字图像中像素值的子集的向下缩放技术,使得可以基于两个或更多个保留像素值来内插向上缩放的图像中的所有重构像素值。在一些方面中,图像向下缩放器可以基于与用于向下缩放每个图像图块的向下缩放操作相关联的基础图块大小和一个或多个缩放因子将数字图像划分成多个图像图块。基础图块大小指示向下缩放的图块的尺寸。一个或多个缩放因子分别指示由于向下缩放操作的一次或多次循环而保留的像素值之间的距离,其中每次循环保留来自原始图像(作为较低分辨率图块)的像素值的较小子集。

    用于熵编码的压缩概率表
    3.
    发明公开

    公开(公告)号:CN117595884A

    公开(公告)日:2024-02-23

    申请号:CN202310984402.9

    申请日:2023-08-07

    Inventor: S·L·兰塞姆

    Abstract: 本公开提供了用于数据压缩的方法、设备和系统。本实施方式更具体地涉及用于压缩用于熵编码的概率表的编码技术。在一些方面中,熵编码器可以对概率表进行编码,使得一个或多个上下文由比原本将每个符号的频率表示为与这样的上下文相关联的所有符号的总频率的比例所需要的更少的比特来表示。例如,如果概率表的给定行(在编码之前)包括多个(M个)条目,每个条目具有由多个(K个)比特表示的二进制值,则相同的条目行可由编码概率表中的少于M*K个比特来表示。

Patent Agency Ranking