基于多层次级联结构的图像风格迁移方法

    公开(公告)号:CN118350984A

    公开(公告)日:2024-07-16

    申请号:CN202410608320.9

    申请日:2024-05-16

    Inventor: 丁建睿 张听 丁卓

    Abstract: 本发明公开了一种基于多层次级联结构的图像风格迁移方法,步骤包括:将风格图和内容图输入到级联编码器中得到不同尺度的风格语义特征以及内容语义特征;对风格语义特征以及内容语义特征的每一尺度使用协方差变换网络进行特征融合,生成融合特征图;对融合特征图计算多级风格损失;对多级风格损失计算后的融合特征图计算多级内容损失;对计算损失后的融合特征图进行解码操作并作为下一级特征融合的内容图,经过级联的编解码器结构最终生成多层次风格迁移后的风格化图像。该图像风格迁移方法能够有效提升模型在不同风格特征迁移情况下对风格图的特征捕捉和迁移能力。

    基于选择性扫描视觉状态空间模型的视频序列分割方法

    公开(公告)号:CN119206568A

    公开(公告)日:2024-12-27

    申请号:CN202411238187.9

    申请日:2024-09-05

    Inventor: 丁建睿 张听 丁卓

    Abstract: 本发明涉及深度学习语义分割技术领域,尤其涉及一种基于选择性扫描视觉状态空间模型的视频序列分割方法,将图像序列输入到重叠特征块划分层,将输入图像序列划分为图像特征块序列;将图像特征块序列输入到基于选择性扫描视觉的状态空间模型编码器中提取不同尺度上的粗细特征序列;将不同尺度上的粗细特征序列输入到多层感知机层进行多级特征的有效融合得到特征序列;将特征序列输入到基于卷积神经网络的轻量级解码头预测分割掩码,并进行视觉可视化生成语义分割图;以此方式解决了现有技术中传统的卷积神经网络接受范围有限,并且基于自注意力的网络在构建长期依赖方面具有极高的计算复杂度,从而导致图像序列分割效果差的技术问题。

Patent Agency Ranking