视频生成、模型的训练方法及系统

    公开(公告)号:CN119653201A

    公开(公告)日:2025-03-18

    申请号:CN202411702267.5

    申请日:2024-11-25

    Abstract: 本说明书提供一种视频生成、模型的训练方法及系统。其在获得视频描述信息和N个语义扩展指令之后,基于预先训练好的视频生成模型中的语义特征生成网络对视频描述信息和N个语义扩展指令进行语义提取得到目标语义特征,并通过视频生成模型中的视频生成网络基于目标语义特征进行视频生成,得到并输出与视频描述信息的语义相符的目标视频。在该方法中,由于语义特征生成网络和视频生成网络在视频生成模型的训练过程中被联合训练过,因此语义特征生成网络可以生成更贴合视频生成网络需求的目标语义特征,视频生成网络可以更加准确地依据目标语义特征来生成高质量的目标视频,从而提高了视频生成模型的整体性能和目标视频的生成效果。

    图生视频模型的训练方法、装置、设备和存储介质

    公开(公告)号:CN119629426A

    公开(公告)日:2025-03-14

    申请号:CN202411746608.9

    申请日:2024-11-29

    Abstract: 本申请一个或多个实施例提供一种图生视频模型的训练方法、装置、设备和存储介质,所述方法包括:获取第一样本视频,并从所述第一样本视频中提取图像帧;获取由训练完成的运动估计模型针对所述第一样本视频进行运动强度评估,得到的所述第一样本视频的多种类型的运动强度数据;将所述图像帧和所述多种类型的运动强度数据输入预设的图生视频模型,由所述图生视频模型基于所述图像帧和所述多种类型的运动强度数据进行计算,生成对应的视频;基于生成的视频确定训练损失,并在根据所述损失完成针对所述图生视频模型的模型参数的调整后,确定完成针对所述图生视频模型的训练。

Patent Agency Ranking