-
公开(公告)号:CN120013814A
公开(公告)日:2025-05-16
申请号:CN202411864850.6
申请日:2024-12-18
Applicant: 北京工业大学
IPC: G06T5/77 , G06T5/60 , G06V10/42 , G06V10/44 , G06V10/80 , G06V10/82 , G06N3/0455 , G06N3/0464
Abstract: 本发明实施例提供一种基于Transformer的图像恢复方法,该方法包括:对输入图像进行初步处理后获得图像特征;将图像特征输入至不同网络深度的局部‑区域‑全局感知注意基础模块LRG中以获取融合后的图像特征;对融合后的图像特征执行下采样操作,以获取不同维度的图像特征;将不同维度的图像特征逐层融合,将融合后的不同维度的图像特征上采样至图像特征的特征大小;将上采样后的特征与融合后的图像特征进行concatenate操作,并融入输入图像的图像特征以得到输出图像特征,将输出图像特征转换为输出图像。本公开能够将局部和全局的多尺度特征进行融合,并将融合后的多尺度特征信息进行通道维度和空间维度的融合,增强通道间的信息交互和空间建模能力。
-
公开(公告)号:CN119295599A
公开(公告)日:2025-01-10
申请号:CN202411237551.X
申请日:2024-09-05
Applicant: 北京工业大学
Abstract: 本发明实施例提供一种轨道交通图像的生成方法,所述方法包括:获取轨道交通图像并输入至图像生成网络中,将图像初步处理为隐空间特征,并融合特征提取模块生成的特征提示以生成辅助特征;根据辅助特征指导扩散模型对经过初步处理的图像执行去噪过程,得到生成图像特征,将生成图像特征解码为输出图像。本发明所提出的生成方法通过使用少量的图像实现对扩散模型的微调,并生成多样化的图像;利用图像特征代替文本特征克服了文图数据标注繁琐、模型难以训练的问题;利用隐空间特征,使扩散模型在生成图像的过程中降低资源消耗,快速高效的完成轨道交通图像生成任务。
-