-
公开(公告)号:CN119006310A
公开(公告)日:2024-11-22
申请号:CN202411023647.6
申请日:2024-07-29
Applicant: 广东美晨通讯有限公司
IPC: G06T5/60 , G06T5/70 , G06N3/0464 , G06N3/0455 , G06V10/44 , G06V10/77 , G06V10/82
Abstract: 本发明公开了一种基于扩散模型的图像风格化方法,包括以下步骤:S1,输入原始图像;S2,对原始图像分成上步骤和下步骤进行处理,上步骤和下步骤中均在前向过程中还原为初始高斯噪声图像;S3,将上步骤中的初始高斯噪声图像,在反向过程中以噪扩散隐式模型DDIM逐步去噪,得到原始去噪图像,然后提取出空间特征S4,将下步骤中的初始高斯噪声图像,在反向过程中以文本条件稳定扩散模型LDM逐步去噪,同时加入步骤S3中得到的空间特征及输入引导文本,输出风格图像。本发明提高了原始图像结构的保真度,减轻原始图像不必要外观泄漏的问题,提高风格图像的风格化程度。