图像处理方法、图像处理装置及存储介质

    公开(公告)号:CN118799178A

    公开(公告)日:2024-10-18

    申请号:CN202410263143.5

    申请日:2024-03-07

    Abstract: 本申请实施例提供了一种图像处理方法、图像处理装置及存储介质,该方法包括:图像处理装置将待预测LR图像输入至第一目标清晰化模型,获得待预测LR图像对应的SR图像;其中,第一目标清晰化模型是第二目标清晰化模型和第三目标清晰化模型融合获得的;第二目标清晰化模型是通过第一损失函数和渐进式训练策略对第一初始清晰化模型进行训练获得的;第一初始清晰化模型包括初始教师网络模型和初始学生网络模型;初始学生网络模型至少包括重参数化模块;第三目标清晰化模型用于重建第一生物特征的图像信息,从而可以提升模型的重建性能。

    视频生成方法、装置、设备及介质

    公开(公告)号:CN118799460A

    公开(公告)日:2024-10-18

    申请号:CN202410016562.9

    申请日:2024-01-05

    Abstract: 本发明提供一种视频生成方法、装置、设备及介质。本发明的方法,包括:针对第一视频中的帧图像,将帧图像、第一目标外貌图像和多帧第一稠密姿态图像输入至视频生成模型,获得第一噪声;其中,第一目标外貌图像为具有第一目标外貌的人物图像,多帧第一稠密姿态图像包括连续多帧与第一目标姿态相关的人物图像,视频生成模型包括训练后的第一噪声预测模型和训练后的第二噪声预测模型,训练后的第一噪声预测模型用于捕捉目标姿态,训练后的第二噪声预测模型用于恢复目标外貌;对第一噪声进行去噪处理,获得去噪后的帧图像;根据去噪后的帧图像,生成第二视频。本发明的方法能够大大提升了生成视频的视觉质量。

    说话人视频生成方法、装置及电子设备

    公开(公告)号:CN116916114A

    公开(公告)日:2023-10-20

    申请号:CN202310569462.4

    申请日:2023-05-19

    Abstract: 本发明提供一种说话人视频生成方法、装置及电子设备,涉及人工智能技术领域,其中,所述方法包括:基于预训练的语音特征提取网络提取目标音频的语音特征;提取目标图像的深度信息,并对所述目标图像的像素进行稀疏采样处理,得到多个离散像素位置;基于所述深度信息对每个所述离散像素位置发出的光线进行空间点采样处理,得到每个离散像素位置对应的多个空间点位置;基于所述语音特征确定所述多个空间点位置对应的特征信息;对所述特征信息进行渲染处理,得到说话人视频。本发明实施例能够提高说话人视频的生成速度。

Patent Agency Ranking