基于窗口注意力的神经数据依赖变换的图像压缩方法

    公开(公告)号:CN116630448A

    公开(公告)日:2023-08-22

    申请号:CN202310580643.7

    申请日:2023-05-23

    Abstract: 基于窗口注意力的神经数据依赖变换的图像压缩方法属于计算机视觉领域。考虑每个输入图像的率失真RD性能很有意义,现有方法没有充分考虑每个图像的概率属性和局部纹理,RD性能有待进一步提高。本发明中扩展的窗口注意力模型(EWAM)联合学习图像的概率属性和局部纹理。一种基于卷积神经网络的框架,包括以下组件:语法生成器和权重生成器,通过模型流来学习语法和语法权重;上下文模型,通过内容流来学习内容;超先验模型,通过潜在表示学习分布;以及EWAM,通过窗口注意力进一步提高概率属性的精度和局部纹理的清晰度。本发明不仅能够在线优化每张图像的RD性能,而且具有更清晰的纹理和结构,在客观指标上优于目前最先进的方法。

Patent Agency Ranking