基于自注意力和关键帧的免训练长视频编辑方法及装置

    公开(公告)号:CN119697444A

    公开(公告)日:2025-03-25

    申请号:CN202411887053.X

    申请日:2024-12-20

    Applicant: 厦门大学

    Abstract: 本发明公开了一种基于自注意力和关键帧的免训练长视频编辑方法及装置,涉及视频编辑技术领域,方法包括:使用预训练的扩散模型提取原视频每一帧的扩散特征;根据扩散特征计算原视频各帧之间的相似度,得到任意两帧之间的相似度热图;基于相似度热图判断出各帧内容的相似度,根据相似度对视频进行动态分段,获得多个视频片段;在每个视频片段中采样至少一帧关键帧;基于扩散特征计算当前查询关键帧与其他所有关键帧之间的相似度,对关键帧进行自适应注意力剪枝;将编辑后的关键帧信息传播到视频中的其余帧。本发明通过自适应注意力机制和关键帧选择技术,能够保持视频内容连贯性和一致性,减少计算资源消耗,并提高视频编辑的质量和效率。

Patent Agency Ranking