视频编辑方法及装置
    1.
    发明授权

    公开(公告)号:CN117315056B

    公开(公告)日:2024-03-19

    申请号:CN202311594465.X

    申请日:2023-11-27

    Abstract: 本说明书实施例提供一种视频编辑方法及装置,其中视频编辑的实现基于预训练的文生图模型,所述文生图模型包括Unet模型。该方法包括:首先,确定与原始视频的n个视频帧对应的n个加噪编码,以及,确定与引导视频编辑的描述文本对应的文本编码。然后,利用文本编码和Unet模型对n个加噪编码分别进行去噪处理,得到n个去噪编码;其中Unet模型包括接续在目标网络层之后的自注意力层,对任意第i个加噪编码进行的去噪处理包括:在Unet模型的自注意力层中,基于目标网络层针对第i个加噪编码的输出,以及目标网络层针对预定的目标加噪编码的输出进行注意力计算。之后,分别对n个去噪编码进行解码处理,得到n个目标图像,用于形成编辑后的目标视频。

    视频特征模型训练方法及装置、视频特征提取方法及装置

    公开(公告)号:CN116721375A

    公开(公告)日:2023-09-08

    申请号:CN202310700898.2

    申请日:2023-06-13

    Abstract: 本说明书实施例提供了视频特征模型训练方法及装置、视频特征提取方法及装置。在模型训练方法中,获取视频数据,然后按照以下方式对视频特征模型进行训练,直至满足训练结束条件:将视频数据提供给所述视频特征模型,以得到多模态特征;得到各个正例视频对组中的视频帧特征与文本特征之间的正例匹配度得分;根据正例匹配度得分得到为正例视频对组所分配的正例权重;基于负例多模态特征和所述正例多模态特征以及对应的正例权重,利用当前的视频特征模型在预设代理任务中计算第一损失;以及基于第一损失对视频特征模型进行调整。

    辅助用户拍摄车辆视频的方法及装置

    公开(公告)号:CN110650292B

    公开(公告)日:2021-03-02

    申请号:CN201911046418.5

    申请日:2019-10-30

    Inventor: 郭昕 程远 王清

    Abstract: 本说明书实施例提供了辅助用户拍摄车辆视频的方法和装置,一方面,对于所拍摄的视频中的单个帧,可以实时检测其作为图像的有效性。如果单个帧是有效帧,则进一步对于该当前帧作为验车视频中的帧,是否符合验车视频拍摄规则。在当前帧无效,或者不符合验车视频拍摄规则的情况下,可以及时向用户提供拍摄引导策略。如此,可以使得普通用户能够正确拍摄有效的验车视频,提高用户体验,以及验车效率。

    为受损车辆生成定损文件的方法及装置

    公开(公告)号:CN110738576A

    公开(公告)日:2020-01-31

    申请号:CN201910975009.7

    申请日:2019-10-14

    Inventor: 蒋晨 程远 王清

    Abstract: 本说明书实施例提供一种为受损车辆生成定损文件的方法和装置,根据一个实施方式,首先获取基于受损车辆的现场视频确定的受损部件标注结果和损伤程度标注结果,其中,受损部件标注结果指示出受损部件和损伤区域,受损程度标注结果是基于受损部件标注结果,对各个受损部件的损伤程度的识别结果,接着,至少将受损部件标注结果和受损程度标注结果输入预先训练的定损模型,其中,定损模型基于多个定损人员的历史定损数据和/或多个维修人员的历史维修数据而训练,用于生成损伤维修方案,然后,基于定损模型的输出结果,为受损车辆生成定损文件。如此,可以提高车辆定损的有效性。

    辅助用户拍摄车辆视频的方法及装置

    公开(公告)号:CN110650292A

    公开(公告)日:2020-01-03

    申请号:CN201911046418.5

    申请日:2019-10-30

    Inventor: 郭昕 程远 王清

    Abstract: 本说明书实施例提供了辅助用户拍摄车辆视频的方法和装置,一方面,对于所拍摄的视频中的单个帧,可以实时检测其作为图像的有效性。如果单个帧是有效帧,则进一步对于该当前帧作为验车视频中的帧,是否符合验车视频拍摄规则。在当前帧无效,或者不符合验车视频拍摄规则的情况下,可以及时向用户提供拍摄引导策略。如此,可以使得普通用户能够正确拍摄有效的验车视频,提高用户体验,以及验车效率。

    用于模型训练的数据集的构建方法和装置

    公开(公告)号:CN118155016A

    公开(公告)日:2024-06-07

    申请号:CN202410303824.X

    申请日:2024-03-15

    Abstract: 本说明书实施例提供一种用于模型训练的数据集的构建方法和装置,方法包括:获取第一数据集,包括若干组初始图文对;针对第一数据集中的任一组初始图文对,计算其包括的初始图片和初始文本的相似度得分;根据相似度得分和预先设定的分数阈值,将第一数据集中的各组初始图文对划分为高质数据、中质数据和低质数据;针对属于中质数据的任一组初始图文对,提取其包括的初始图片,根据该初始图片生成对应的文本描述,利用初始图片和对应的文本描述组成一组更新图文对;将各组更新图文对和属于高质数据的各组初始图文对加入第二数据集,第二数据集作为用于模型训练的数据集。能够获取足够数量的满足要求的训练数据,从而提升模型的训练效果。

    辅助用户拍摄车辆视频的方法及装置

    公开(公告)号:CN113038018B

    公开(公告)日:2022-06-28

    申请号:CN202110313504.9

    申请日:2019-10-30

    Inventor: 郭昕 程远 王清

    Abstract: 本说明书实施例提供了辅助用户拍摄车辆视频的方法和装置,一方面,对于所拍摄的视频中的单个帧,可以实时检测其作为图像的有效性。如果单个帧是有效帧,则进一步对于该当前帧作为验车视频中的帧,是否符合验车视频拍摄规则。在当前帧无效,或者不符合验车视频拍摄规则的情况下,可以及时向用户提供拍摄引导策略。如此,可以使得普通用户能够正确拍摄有效的验车视频,提高用户体验,以及验车效率。

Patent Agency Ranking