-
公开(公告)号:CN118741069A
公开(公告)日:2024-10-01
申请号:CN202410756606.1
申请日:2024-06-12
Applicant: 北京达佳互联信息技术有限公司 , 中科计算技术创新研究院
IPC: H04N13/275 , H04N13/282 , H04N21/81 , G06N3/096
Abstract: 本公开关于一种文本输入生成动态三维视频的方法、装置、电子设备、计算机存储介质以及计算机程序产品,所述方法包括:获取文本数据,并基于文本数据生成满足文本数据的描述内容的参考视频;以文本数据和参考视频中的参考图片作为约束条件,生成满足文本数据描述和参考图片的静态三维模型;基于静态三维模型,确定动态信息生成模型;基于混合先验优化策略对动态信息生成模型优化监督,并基于优化监督后的动态信息生成模型,生成文本数据对应的三维视频;混合先验优化策略包括参考视频的直接先验和扩散模型的蒸馏先验。采用本方法,增强了三维视频的动态效果。
-
公开(公告)号:CN114140315B
公开(公告)日:2025-05-06
申请号:CN202111285143.8
申请日:2021-11-01
Applicant: 北京达佳互联信息技术有限公司
IPC: G06F16/535
Abstract: 本公开关于一种图像处理方法、装置、电子设备及存储介质。该方法包括:获取待处理图像及待处理图像的属性信息,包括美学特征信息、时间信息、空间信息以及所属用户的社交信息;计算待处理图像与候选图像之间的属性相似度,并将属性相似度最高的候选图像作为参考图像;提取待处理图像的美学特征信息的特征和参考图像的美学特征信息的特征,分别得到待处理特征信息和参考特征信息;对待处理特征信息及参考特征信息进行特征对齐及特征融合,对得到的融合美学特征信息进行解码处理,得到目标美化图像。这样,通过确定与待处理图像的属性相似度较高的参考图像,结合参考图像对待处理图像进行处理,得到的目标美化图像可以更好的满足用户审美需求。
-
公开(公告)号:CN114998196B
公开(公告)日:2025-02-18
申请号:CN202210426094.3
申请日:2022-04-21
Applicant: 清华大学 , 北京达佳互联信息技术有限公司
IPC: G06T7/00 , G06T3/04 , G06V10/774 , G06V10/74
Abstract: 本公开是关于一种图像检测模型的训练方法、图像检测方法、装置及设备,属于计算机技术领域。方法包括:获取属于目标风格的标准图像;调用正在训练的图像生成模型,对原始图像进行风格迁移得到目标图像;基于目标图像确定与目标图像的风格匹配的第一样本图像,基于图像生成模型的训练次数,确定样本标签;调用待训练的图像检测模型,将第一样本图像与标准图像进行对比,得到第一检测标签;基于样本标签和第一检测标签,训练待训练的图像检测模型,得到训练完成的图像检测模型。本公开提供了一种自动生成样本图像和样本标签的方式,然后利用样本图像、样本标签和标准图像,训练图像检测模型,从而使用图像检测模型来对图像风格进行检测。
-
公开(公告)号:CN118747862A
公开(公告)日:2024-10-08
申请号:CN202410833892.7
申请日:2024-06-25
Applicant: 北京达佳互联信息技术有限公司
IPC: G06V20/40 , G06V10/774 , G06V10/75 , G06F9/50
Abstract: 本公开关于一种图生视频模型生成方法、视频生成方法及装置,该图生视频模型生成方法包括:输入样本图像和样本文本描述信息至预设文生视频模型;基于空间模块对样本图像和样本文本描述信息进行空间特征提取处理,得到第一样本特征处理结果;基于时序自注意力模块对第一样本特征处理结果进行处理,得到第二样本特征处理结果;以及基于运动适配器模块对第一样本特征处理结果进行运动信息控制,得到第三样本特征处理结果;根据第二样本特征处理结果和第三样本特征处理结果生成预测视频数据;根据预设视频数据和样本视频数据更新空间模块和运动适配器模块的参数,得到图生视频模型。本公开能够控制生成视频的运动信息,且降低对系统资源的消耗。
-
公开(公告)号:CN114222181B
公开(公告)日:2024-03-12
申请号:CN202111333912.7
申请日:2021-11-11
Applicant: 北京达佳互联信息技术有限公司
IPC: H04N21/44 , H04N21/4402 , G06T7/13
Abstract: 本公开关于一种图像处理方法、装置、设备及介质,包括:获取原始视频,所述原始视频中的视频帧图像包括待抠取对象;基于目标抠像模型,从所述视频帧图像中抠取所述待抠取对象,得到所述待抠取对象对应的初始对象编码数据,所述初始对象编码数据表征所述视频帧图像中所述待抠取对象的初始轮廓信息;响应于所述原始视频对应的抠像视频的播放请求,根据所述初始对象编码数据和所述视频帧图像,生成所述待抠取对象对应的对象抠像图像;基于所述对象抠像图像,播放所述抠像视频,本公开的实施能够保证播放对象抠像图像更加的流畅,减少对播放对象抠像图像的等待时长,提升用户体验。
-
公开(公告)号:CN112907725B
公开(公告)日:2023-09-26
申请号:CN202110087579.X
申请日:2021-01-22
Applicant: 北京达佳互联信息技术有限公司
IPC: G06T17/00 , G06V40/16 , G06V10/82 , G06N3/044 , G06N3/0455 , G06N3/0475 , G06N3/094
Abstract: 本公开关于一种图像生成、图像处理模型的训练、图像处理方法和装置,涉及图像处理技术领域。方法包括:确定用于生成人脸图像的第一隐变量;将第一隐变量输入至编码器,得到第一隐变量的面部特征;获取目标表情参数;将第一隐变量的面部特征和目标表情参数输入至解码器中,通过解码器将第一隐变量对应的表情参数调整为目标表情参数,得到第二隐变量;基于第二隐变量,生成目标表情参数对应的面部表情图像。通过上述方案,实现了通过表情参数控制面部图像中的表情,而不对面部表情图像中的其他因素产生影响,从而提高了获取的面部表情图像的准确率,进而降低了获取面部表情图像的难度。
-
公开(公告)号:CN114327671A
公开(公告)日:2022-04-12
申请号:CN202111470898.5
申请日:2021-12-03
Applicant: 北京达佳互联信息技术有限公司
Abstract: 本公开关于一种参数配置方法、装置、设备及存储介质,涉及移动设备技术领域,本公开中,移动设备响应于目标应用程序的启动,向服务器发送用于获取更新的算法模型配置参数,并当未从服务器获取更新的算法模型配置参数时,向服务器发送用于获取更新的算法模型数据;当未从服务武器获取跟更新的算法模型配置参数以及更新的算法模型数据时,使用预先配置的算法模型参数对目标应用程序进行配置。如此,在保证移动设备的算法模型配置参数更新的情况下,可以及时更新自身的算法模型配置参数。
-
公开(公告)号:CN114078082A
公开(公告)日:2022-02-22
申请号:CN202010796905.X
申请日:2020-08-10
Applicant: 北京达佳互联信息技术有限公司
Abstract: 本公开关于一种人物图像性别转换模型的训练、图像生成方法及装置,其中,配对图像数据生成模型的训练方法包括:获取非配对图像样本集,非配对图像样本集中包括无配对关系的男性人物图像集和女性人物图像集;将非配对图像样本集输入至第一深度学习模型中进行训练,得到配对图像生成模型;将待配对人物图像输入至配对图像生成模型中,输出目标人物图像;将配对图像样本集输入至第二深度学习模型中进行训练,得到人物性别转换模型,人物性别转换模型用于执行人物性别转换操作。本公开的方案,可以解决相关技术中对人物图像进行性别转换时灵活度较差的问题,可以得到与人物图像性别相反的配对图像数据,为后续生成丰富的魔法表情提供依据。
-
公开(公告)号:CN113723480A
公开(公告)日:2021-11-30
申请号:CN202110949361.0
申请日:2021-08-18
Applicant: 北京达佳互联信息技术有限公司
Abstract: 本公开关于一种图像处理方法、装置、电子设备和存储介质,涉及图像处理技术领域,以至少解决相关技术中压缩奖惩模块的缺点是对基于深度学习的图像风格迁移网络中深层特征的准确率提升较明显,但是对基于深度学习的图像风格迁移网络中较浅特征的准确率提升不明显的问题。该方法包括:采用编码器对原始图像进行特征提取,获得原始图像在编码器的每一层次结构的编码特征;其中,编码特征包括浅层特征;将编码特征输入到解码器中,并执行第一操作,得到结果特征图;其中,编码器和解码器内包含的层次结构的总数相同;根据结果特征图,确定原始图像的处理结果。
-
公开(公告)号:CN113486842A
公开(公告)日:2021-10-08
申请号:CN202110836624.7
申请日:2021-07-23
Applicant: 北京达佳互联信息技术有限公司
Abstract: 本公开关于一种表情编辑模型的训练方法和装置及表情编辑方法和装置。所述表情编辑模型包括表情特征提取网络、面容特征提取网络和图像合成网络,所述训练方法包括:将表情样本图像分别输入至面容特征提取网络和表情特征提取网络;利用表情特征提取网络,提取表情样本图像的表情特征;利用面容特征提取网络,提取表情样本图像的面容特征;将面容特征和表情特征输入至图像合成网络,得到表情编辑图像;根据所述表情样本图像与所述表情编辑图像,调整面容特征提取网络、表情特征提取网络和图像合成网络的参数,以对所述表情编辑模型进行训练。
-
-
-
-
-
-
-
-
-