-
公开(公告)号:CN119722438A
公开(公告)日:2025-03-28
申请号:CN202411747070.3
申请日:2024-12-02
Applicant: 西北工业大学
Abstract: 本申请公开了一种基于语义对齐的图像风格迁移方法、装置、介质和设备,通过获取风格图像和内容图像,利用预构建的风格迁移网络处理风格图像和所述内容图像,得到风格化图像,其中,风格迁移网络包括编码模块、解码模块、第一风格注意模块、第二风格注意模块,第一自适应解耦模块、第二自适应解耦模块、第一动态风格调制核模块和第二动态风格调制核模块,输出所述风格化图像,通过风格注意模块将内容图的特征映射到风格图的内容特征之间建立映射关系,引入基于内容的动态风格调制核模块对映射矩阵进行调整,同时使用自适应解耦模块实现内容与风格的显式解耦,从而实现语义、风格更加和谐的图像风格迁移效果。
-
公开(公告)号:CN119128642A
公开(公告)日:2024-12-13
申请号:CN202411198761.2
申请日:2024-08-29
Applicant: 西北工业大学
IPC: G06F18/241 , G06F18/10 , G06F18/213 , G06V20/40 , G06V20/70 , G06F16/34 , G06N3/0455 , G06N3/0495 , G06N3/09 , G06N5/04
Abstract: 一种多模态大模型用于风险内容识别与摘要生成方法,包括采集风险内容数据并进行数据预处理,基于预处理后的风险内容数据划分得到训练集和测试集;利用训练集对Chameleon‑7B进行模型微调,得到风险识别大模型RiskContent‑Valuer;将测试集数据输入RiskContent‑Valuer进行抽象特征提取,得到风险内容识别与摘要生成结果;其中,模型微调前利用BitsAndBytesConfig接口量化基础模型Chameleon‑7B,通过量化层将模型权重转化为int4并放入GPU,将核心计算过程在CUDA上完成;采用监督学习和LoRA方法进行模型微调。本申请利用LoRA大幅度降低计算资源的消耗,继承了跨越不同模态和体裁的强大语言理解能力,实现了准确的风险内容评估与总结果,同时提供风险点摘要。
-
公开(公告)号:CN118506367A
公开(公告)日:2024-08-16
申请号:CN202410604997.5
申请日:2024-05-15
Applicant: 西北工业大学
IPC: G06V20/80 , G06V10/143 , G06V10/58 , G06V10/80 , G06V10/94
Abstract: 本发明公开了一种文物艺术品多模态可复现图谱信息获取与鉴别系统及方法,包括文物艺术品多模态可复现图谱信息获取系统、多模态图谱信息备案数据库和多模态图谱信息智能处理系统;本发明能够提高文物艺术品多维信息的提取能力和文物鉴别与病害分析能力,进而保障文物艺术品收藏或流转环境的安全。
-
-