-
公开(公告)号:CN118711010A
公开(公告)日:2024-09-27
申请号:CN202410732903.2
申请日:2024-06-06
Applicant: 北京达佳互联信息技术有限公司
IPC: G06V10/774 , G06V10/80 , G06V10/56 , G06V10/82 , G06N3/08
Abstract: 本公开关于一种图像生成模型训练方法、图像生成方法及相关设备,该方法包括:获取样本图像集,确定样本图像集中各样本图像的分辨率;根据各样本图像的分辨率对应的宽高比对样本图像进行聚类处理,得到多个目标聚类样本图像集;多个目标聚类样本图像集对应不同的预设分辨率宽高比;根据每个目标聚类样本图像集对应的预设分辨率宽高比,将目标聚类样本图像集中样本图像的分辨率调整为与预设分辨率宽高比对应的目标分辨率,得到多个训练样本图像集;基于多个训练样本图像集对图像去噪网络进行多轮迭代训练,得到图像生成模型;多轮迭代训练中每轮迭代训练基于不同的训练样本图像集。本公开确保了训练所得图像生成模型能稳定地生成高质量的图像。
-
公开(公告)号:CN118505569A
公开(公告)日:2024-08-16
申请号:CN202410171850.1
申请日:2024-02-06
Applicant: 北京达佳互联信息技术有限公司
IPC: G06T5/77 , G06V10/764
Abstract: 本公开关于一种图像细节修复模型训练方法、装置、电子设备及存储介质。方法包括:获取测试样本集;测试样本集包括与各预设垂类对应的提示文本数据;将各提示文本数据输入至预训练的扩散去噪模型,通过预训练的扩散去噪模型生成与提示文本数据匹配的目标图像;根据各预设垂类对应的图像细节评估信息,在各预设垂类中筛选出目标垂类;目标垂类对应的图像细节评估信息满足预设的图像质量异常条件;根据目标垂类对应的图像数据构建训练样本集,并根据训练样本集训练图像细节修复模型,得到预训练的图像细节修复模型;预训练的图像细节修复模型用于对预训练的扩散去噪模型生成的图像进行细节修复。采用本方法能够提高模型生成的图像的细节质量。
-
公开(公告)号:CN118429531A
公开(公告)日:2024-08-02
申请号:CN202410509552.9
申请日:2024-04-25
Applicant: 中国人民大学 , 北京达佳互联信息技术有限公司
Abstract: 本公开提供了一种三维对象的生成方法、装置、设备及存储介质,属于计算机技术领域。方法包括:在第i轮迭代过程中,通过三维对象生成模型对第一多视角图像进行精调,得到第二多视角图像,第一多视角图像为对第一三维信息表示的目标三维对象从不同视角渲染得到的多个二维图像;基于第一多视角图像和第二多视角图像之间的差异,对第一三维信息进行多次更新,得到第二三维信息,第二三维信息用于表示第i轮迭代生成的目标三维对象;响应于满足迭代结束条件,基于第二三维信息,生成目标三维对象。该方法能够大大减少生成目标三维对象过程中所需的三维对象生成模型的总前向计算次数,提高三维对象的生成效率。
-
公开(公告)号:CN112364933B
公开(公告)日:2024-07-12
申请号:CN202011322350.1
申请日:2020-11-23
Applicant: 北京达佳互联信息技术有限公司
IPC: G06V10/764 , G06V10/26 , G06V10/44 , G06V10/77 , G06V10/82
Abstract: 本申请公开了一种图像分类方法、装置、电子设备和存储介质,用于解决相关技术中分类精度有所提升,但时间消耗也大幅增加的问题。本申请中对目标图像的特征图进行裁剪处理得到多张特征子图,并提取特征子图之间的交互关系后,基于包含交互关系的特征信息进行分类识别。由于提取特征子图的关联关系的方法在时间消耗上远远小于从原始图像裁剪出的部分的分类处理,故此,本申请的图像分类方法能够节约时间消耗。此外,由于对特征图的裁剪和提取出不同特征子图关联关系,使得分类精度相较于整图识别的方式有所提升。故此,本申请实施例的图像分类方法是一种从时间消耗和精度上进行权衡后的一个较佳方法。
-
公开(公告)号:CN118154438A
公开(公告)日:2024-06-07
申请号:CN202410275246.3
申请日:2024-03-11
Applicant: 北京达佳互联信息技术有限公司
Abstract: 本公开关于一种图像扩展方法、装置、电子设备及存储介质,该方法包括:获取待扩展图像的隐空间特征图;分别提取待扩展图像的掩码特征和全局特征,得到掩码特征图和全局特征图;该掩码特征图的分辨率与待生成的目标扩展图像的分辨率相同,掩码特征图包括原图区域和待扩展区域,该原图区域为待扩展图像中的至少部分图像,该待扩展区域的像素值为预设像素值;对隐空间特征图、掩码特征图和全局特征图进行融合处理,得到扩展条件特征图;基于扩展条件特征图对隐空间特征图进行去噪处理,得到去噪隐空间特征图;对去噪隐空间特征图进行图像重构处理,得到目标扩展图像。本公开提高了图像扩展的质量,生成的图像区域更加自然、准确。
-
公开(公告)号:CN118115613A
公开(公告)日:2024-05-31
申请号:CN202410030784.6
申请日:2024-01-08
Applicant: 北京达佳互联信息技术有限公司
Abstract: 本公开关于文生图模型的训练方法和基于文本的图像生成方法,所述训练方法包括:获取包含同一目标对象的多个样本图像;将样本图像输入预设的图像描述模型进行图像特征提取,得到表征样本图像的整体特征的描述性标签;获取表征目标对象所属类别的类别描述符,并将类别描述符输入预设的初始文生图模型进行文生图处理,生成多个正则化图像;将标注有目标对象的标识符和描述性标签的多个样本图像、多个正则化图像,输入初始文生图模型进行扩散训练,得到第一目标文生图模型;本公开使得模型能够充分学习目标对象的特征,并同时保持目标对象所具有的类别特征,增强了对目标对象的外观特征学习能力,生成的图像与目标对象的相似度较高。
-
公开(公告)号:CN118096573A
公开(公告)日:2024-05-28
申请号:CN202410271216.5
申请日:2024-03-11
Applicant: 北京达佳互联信息技术有限公司
Abstract: 本公开关于图像处理方法、装置、电子设备及存储介质,涉及计算机技术领域,方法包括:获取初始人台模特图像、模特形象指示信息和背景指示信息;确定初始人台模特图像对应的服饰蒙版图、初始人台模特图像对应的边缘检测图和初始人台模特图像对应的深度图;将初始人台模特图像、模特形象指示信息、背景指示信息、服饰蒙版图、边缘检测图和深度图输入多条件可控扩散模型,以使多条件可控扩散模型以服饰蒙版图、边缘检测图和深度图为图像控制条件,以模特形象指示信息和背景指示信息为文本控制条件,对初始人台模特图像进行图像可控编辑处理,得到虚拟模特图像。利用本公开实施例提供的技术方案可以多方面提升虚拟模特图像的质量。
-
公开(公告)号:CN118037872A
公开(公告)日:2024-05-14
申请号:CN202410010879.1
申请日:2024-01-03
Applicant: 北京达佳互联信息技术有限公司
IPC: G06T11/00 , G06V10/52 , G06N3/0464 , G06N3/084
Abstract: 本公开关于一种图像生成模型的训练、风格图像生成方法及装置,该图像生成模型的训练方法包括基于图文对齐模型,在对每个第一样本图文对进行图文特征对齐的基础上,分别提取样本图像特征和样本文本特征;将样本图像特征输入待训练适配模型进行空间适配映射,得到样本空间适配特征;将样本文本特征和样本空间适配特征输入文生图模型进行图像生成处理,得到预测风格图像;基于预测风格图像和预设风格图像,对待训练适配模型进行训练,得到空间适配模型;基于图文对齐模型、空间适配模型和文生图模型,构建风格图像生成模型。利用本公开实施例可以提升生成的风格图像对主体对象的表征精准性,提升风格转换的多样性,增强可玩性和趣味性。
-
公开(公告)号:CN118014858A
公开(公告)日:2024-05-10
申请号:CN202410116927.5
申请日:2024-01-26
Applicant: 北京达佳互联信息技术有限公司
IPC: G06T5/50 , G06T5/70 , G06V10/80 , G06V10/82 , G06N3/0455 , G06N3/0464
Abstract: 本公开关于一种图像融合方法、装置、电子设备及存储介质,该方法包括:获取至少两张待融合图像,并通过图像编码器对各待融合图像进行编码,得到多个待融合图像特征;根据训练好的图文转换模型以及多个待融合图像特征,得到各待融合图像特征对应的文本特征;根据训练好的图像扩散模型对标准噪声数据进行扩散处理,得到包含各待融合图像的图像信息的噪声信息,生成融合图像。通过采用本公开,采用图文转换模型对图像和文本进行互译,得到多张图像的图像特征和相对应的文本语义特征,并通过扩散模型中进行去噪,生成包含高层语义特征的融合图像,融合图像与各待融合图像的图像信息相匹配,可以生成视觉效果逼真的融合图像,提升生成的融合图像的质量。
-
公开(公告)号:CN112000819B
公开(公告)日:2023-07-11
申请号:CN201910446528.4
申请日:2019-05-27
Applicant: 北京达佳互联信息技术有限公司
IPC: G06F16/435 , G06N3/0464
Abstract: 本公开是关于一种多媒体资源推荐方法、装置、电子设备及存储介质,属于机器学习技术领域。所述方法包括:将多媒体资源输入卷积神经网络进行特征提取,获取卷积神经网络的N个卷积层的输出特征;对于每一个卷积层的输出特征,基于待推荐用户的身份标识,获取与卷积层的输出特征匹配的用户兴趣信息,将用户兴趣信息作为卷积核与卷积层的输出特征进行卷积操作,得到第一特征矩阵,基于第一特征矩阵生成用户偏好数据;根据生成的N项用户偏好数据,向待推荐用户进行多媒体资源推荐。本公开实施例形成了用户在不同语义层级上对多媒体资源的喜好,而将不同语义层级上的喜好进行融合,进而基于融合结果进行推荐,能够显著提升推荐性能。
-
-
-
-
-
-
-
-
-