一种基于双路视觉Transformer的图像风格迁移方法

    公开(公告)号:CN119068100A

    公开(公告)日:2024-12-03

    申请号:CN202310646537.4

    申请日:2023-06-02

    Applicant: 南京大学

    Abstract: 一种基于双路视觉Transformer的图像风格迁移方法,对内容图像和风格图像分别配置一路视觉Transformer编码器,得到内容编码和风格编码;由Transformer风格参数提取器将风格编码表征为风格参数向量;再通过视觉Transformer图像解码器加权融合内容编码与风格编码,并基于风格参数向量预测目标风格的特征分布参数,得到风格化编码,最后解码输出生成风格化图像。本发明基于双路编码‑解码的视觉Transformer架构,既考虑了不同图像域间的编码差异,提升风格表征的准确性,又引入了风格分布度量,进一步提升风格表达能力,使图像渲染无论是色彩分布还是纹理质感均高度契合真实风格,同时能完整保留原始内容语义,避免因施加局部风格纹理而出现失真问题。

Patent Agency Ranking