-
公开(公告)号:CN119648559A
公开(公告)日:2025-03-18
申请号:CN202411698532.7
申请日:2024-11-25
Applicant: 北京达佳互联信息技术有限公司
IPC: G06T5/70 , G06N3/08 , G06N3/0475 , G06F40/30 , G06N3/0455
Abstract: 本公开关于一种图像生成模型的训练方法、图像生成方法及装置,该方法包括:获取第一样本加噪图像和第一样本描述文本,将第一样本描述文本输入至预设文本编码器中进行文本编码,得到第一全局语义特征和第一字符语义特征;基于第一全局语义特征和样本时间步生成第一样本融合条件特征;将第一字符语义特征、第一样本融合条件特征和第一样本加噪图像输入至预设噪声预测器进行噪声预测处理,得到第一预测噪声;基于去噪网络对第一样本加噪图像进行去噪处理,得到预测图像;根据第一预测噪声和样本噪声标签之间的差异以及预测图像与第一样本图像标签的差异,对预设图像生成模型进行训练,得到目标图像生成模型,提高了图像的语义跟随能力和准确性。
-
公开(公告)号:CN117974477A
公开(公告)日:2024-05-03
申请号:CN202410199945.4
申请日:2024-02-22
Applicant: 北京达佳互联信息技术有限公司
Abstract: 本公开涉及一种图像生成模型的训练方法、图像生成方法、装置、电子设备及计算机可读介质,属于计算机技术领域。该图像生成模型的训练方法包括:根据样本图像和样本描述文本得到图像生成模型的输入样本数据,其中,图像生成模型由低频去噪分支模型、中频去噪分支模型和高频去噪分支模型构成;通过低频去噪分支模型得到样本图像的低频样本去噪结果,通过中频去噪分支模型得到中频样本去噪结果,通过高频去噪分支模型得到高频样本去噪结果;根据低频、中频和高频样本去噪结果得到低频、中频和高频信息损失;根据整体损失对图像生成模型中的模型参数进行迭代训练。本公开通过对图像的低频、中频和高频信息分别进行处理,可以提高模型的图像生成质量。
-