-
公开(公告)号:CN118230090A
公开(公告)日:2024-06-21
申请号:CN202410323843.9
申请日:2024-03-21
Applicant: 南京大学
IPC: G06V10/774 , G06V10/82 , G06V10/46 , G06N3/08
Abstract: 本发明公开了一种基于扩散模型的文本生成材质贴图的优化方法及系统,本发明包括:获取无材质文本标注的第一图像数据集,并将编码生成数据与对应的图像一起作为样本,输入稳定扩散模型的U‑NET模型进行优化训练;获取含有材质文本标注的第二图像数据集,并将图像编码和加噪后的数据,以及图像的材质文本采用两种方式编码的文本嵌入数据作为样本,进行训练,将所述两种不同编码方式和训练好的Transformer解码器组合作为优化文本嵌入生成模块;将隐空间特征解码器进行扩充并训练,作为优化隐空间特征解码器;将优化后的各模块分别替换稳定扩散模型中对应模块,得到优化后的材质贴图生成模型;将待生成贴图的材质文本输入优化后的材质贴图生成模型,得到材质贴图。本发明泛化性更高。