-
公开(公告)号:CN119653197A
公开(公告)日:2025-03-18
申请号:CN202411751163.3
申请日:2024-11-29
Applicant: 北京达佳互联信息技术有限公司
IPC: H04N21/81 , H04N21/854 , H04N21/44
Abstract: 本公开提供了一种视频生成方法、装置、电子设备及存储介质,属于计算机技术领域。在该方法中将从原始图像中提取的语义特征、隐含特征、掩蔽特征等多种图像特征和相机特征作为第一视频生成模型的输入,使得第一视频生成模型不仅能够在动态视频中展示原始图像中的目标对象,还使得第一视频生成模型能够学习到相机特征,从而使动态视频的相机轨迹和相机视角都更加符合展示逻辑。相较于传统的直接将语义特征输入到第一视频生成模型中的方式,本方式通过引入多种图像特征和相机特征,使得第一视频生成模型以目标对象为主体,生成细节更加丰富且更符合展示逻辑的动态视频,提高了视频质量和可用率。
-
公开(公告)号:CN118014858A
公开(公告)日:2024-05-10
申请号:CN202410116927.5
申请日:2024-01-26
Applicant: 北京达佳互联信息技术有限公司
IPC: G06T5/50 , G06T5/70 , G06V10/80 , G06V10/82 , G06N3/0455 , G06N3/0464
Abstract: 本公开关于一种图像融合方法、装置、电子设备及存储介质,该方法包括:获取至少两张待融合图像,并通过图像编码器对各待融合图像进行编码,得到多个待融合图像特征;根据训练好的图文转换模型以及多个待融合图像特征,得到各待融合图像特征对应的文本特征;根据训练好的图像扩散模型对标准噪声数据进行扩散处理,得到包含各待融合图像的图像信息的噪声信息,生成融合图像。通过采用本公开,采用图文转换模型对图像和文本进行互译,得到多张图像的图像特征和相对应的文本语义特征,并通过扩散模型中进行去噪,生成包含高层语义特征的融合图像,融合图像与各待融合图像的图像信息相匹配,可以生成视觉效果逼真的融合图像,提升生成的融合图像的质量。
-
公开(公告)号:CN116740464A
公开(公告)日:2023-09-12
申请号:CN202310827655.5
申请日:2023-07-06
Applicant: 北京达佳互联信息技术有限公司
Inventor: 曾艳兵
IPC: G06V10/764 , G06V10/80 , G06V20/40
Abstract: 本公开涉及一种视频的分类方法、装置、电子设备及计算机可读介质,属于视频处理技术领域。该方法包括:将视频中的各类信息输入视频分类模型中,通过各类特征提取网络提取各类信息分别对应的视频信息特征;通过视频分类模型中的特征融合网络对各类视频信息特征进行特征融合,得到融合视频特征;通过视频分类模型中的混合专家系统对融合视频特征进行处理,得到视频的各层级类目分别对应的各级分类特征;将视频的各级分类特征分别输入各层级类目分别对应的各级分类网络中,得到视频的各级分类结果。本公开通过对视频各类信息特征进行提取和融合,并利用混合专家系统对融合视频特征进行分化,可以一次性输出视频的多层级分类结果,提升视频分类效率。
-
-