-
公开(公告)号:CN119919281A
公开(公告)日:2025-05-02
申请号:CN202411997071.3
申请日:2024-12-31
Applicant: 北京达佳互联信息技术有限公司
IPC: G06T3/067 , G06T17/00 , G06V10/774 , G06N3/0475 , G06V10/82 , G06N3/0455 , G06V10/46 , G06V10/40 , G06V10/80 , G06T5/70
Abstract: 本公开关于图像生成模型训练方法以及图像生成方法,该训练方法包括获取控制模型,以及预训练的图像生成器和文本编码器;获取样本文本和样本参考图像,样本文本为用于描述待生成的图像中的人像的文本内容,样本参考图像指示待生成的图像中的全身人像的形态;将样本文本输入文本编码器进行文本编码,得到样本文本特征;基于控制模型对样本参考图像进行特征处理,得到样本图像引导特征;将样本文本特征和样本图像引导特征输入图像生成器进行图像生成,得到预测图像,预测图像的全身人像包括人脸;基于预测图像调整控制模型参数;对调参后的控制模型、文本编码器和图像生成器进行组合,得到图像生成模型。本公开提供带有人脸的全身人像的生成能力。
-
公开(公告)号:CN118334467A
公开(公告)日:2024-07-12
申请号:CN202410459179.0
申请日:2024-04-16
Applicant: 北京达佳互联信息技术有限公司
IPC: G06V10/774 , G06T3/4053 , G06T3/4046 , G06V10/82
Abstract: 本公开关于一种图像超分辨率模型训练方法、超分辨率处理方法及装置,该图像超分辨率模型训练方法包括:从初始样本图像集中获取对象类别不同、图像风格不同且图像美学评分大于预设美学阈值的第一候选样本图像;从第一候选样本图像中获取文本生成数据大于预设生成阈值的第二候选样本图像;从第二候选样本图像中获取分辨率大于第一预设分辨率阈值的第三候选样本图像;对第三候选样本图像进行数据增强;将增强样本图像和第三候选样本图像输入预设网络,得到超分样本图像,以及根据超分样本图像和第三候选样本图像之间的差异对预设网络进行训练得到图像超分辨率模型。本公开能够针对低分辨率的文本生成图像生成更高分辨率的图像。
-
公开(公告)号:CN118505569A
公开(公告)日:2024-08-16
申请号:CN202410171850.1
申请日:2024-02-06
Applicant: 北京达佳互联信息技术有限公司
IPC: G06T5/77 , G06V10/764
Abstract: 本公开关于一种图像细节修复模型训练方法、装置、电子设备及存储介质。方法包括:获取测试样本集;测试样本集包括与各预设垂类对应的提示文本数据;将各提示文本数据输入至预训练的扩散去噪模型,通过预训练的扩散去噪模型生成与提示文本数据匹配的目标图像;根据各预设垂类对应的图像细节评估信息,在各预设垂类中筛选出目标垂类;目标垂类对应的图像细节评估信息满足预设的图像质量异常条件;根据目标垂类对应的图像数据构建训练样本集,并根据训练样本集训练图像细节修复模型,得到预训练的图像细节修复模型;预训练的图像细节修复模型用于对预训练的扩散去噪模型生成的图像进行细节修复。采用本方法能够提高模型生成的图像的细节质量。
-
公开(公告)号:CN118429531A
公开(公告)日:2024-08-02
申请号:CN202410509552.9
申请日:2024-04-25
Applicant: 中国人民大学 , 北京达佳互联信息技术有限公司
Abstract: 本公开提供了一种三维对象的生成方法、装置、设备及存储介质,属于计算机技术领域。方法包括:在第i轮迭代过程中,通过三维对象生成模型对第一多视角图像进行精调,得到第二多视角图像,第一多视角图像为对第一三维信息表示的目标三维对象从不同视角渲染得到的多个二维图像;基于第一多视角图像和第二多视角图像之间的差异,对第一三维信息进行多次更新,得到第二三维信息,第二三维信息用于表示第i轮迭代生成的目标三维对象;响应于满足迭代结束条件,基于第二三维信息,生成目标三维对象。该方法能够大大减少生成目标三维对象过程中所需的三维对象生成模型的总前向计算次数,提高三维对象的生成效率。
-
-
-