-
公开(公告)号:CN117315056B
公开(公告)日:2024-03-19
申请号:CN202311594465.X
申请日:2023-11-27
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例提供一种视频编辑方法及装置,其中视频编辑的实现基于预训练的文生图模型,所述文生图模型包括Unet模型。该方法包括:首先,确定与原始视频的n个视频帧对应的n个加噪编码,以及,确定与引导视频编辑的描述文本对应的文本编码。然后,利用文本编码和Unet模型对n个加噪编码分别进行去噪处理,得到n个去噪编码;其中Unet模型包括接续在目标网络层之后的自注意力层,对任意第i个加噪编码进行的去噪处理包括:在Unet模型的自注意力层中,基于目标网络层针对第i个加噪编码的输出,以及目标网络层针对预定的目标加噪编码的输出进行注意力计算。之后,分别对n个去噪编码进行解码处理,得到n个目标图像,用于形成编辑后的目标视频。
-
公开(公告)号:CN116721375A
公开(公告)日:2023-09-08
申请号:CN202310700898.2
申请日:2023-06-13
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06V20/40 , G06V10/80 , G06V10/82 , G06N3/0499 , G06N3/08
Abstract: 本说明书实施例提供了视频特征模型训练方法及装置、视频特征提取方法及装置。在模型训练方法中,获取视频数据,然后按照以下方式对视频特征模型进行训练,直至满足训练结束条件:将视频数据提供给所述视频特征模型,以得到多模态特征;得到各个正例视频对组中的视频帧特征与文本特征之间的正例匹配度得分;根据正例匹配度得分得到为正例视频对组所分配的正例权重;基于负例多模态特征和所述正例多模态特征以及对应的正例权重,利用当前的视频特征模型在预设代理任务中计算第一损失;以及基于第一损失对视频特征模型进行调整。
-
公开(公告)号:CN110650292B
公开(公告)日:2021-03-02
申请号:CN201911046418.5
申请日:2019-10-30
Applicant: 支付宝(杭州)信息技术有限公司
IPC: H04N5/232
Abstract: 本说明书实施例提供了辅助用户拍摄车辆视频的方法和装置,一方面,对于所拍摄的视频中的单个帧,可以实时检测其作为图像的有效性。如果单个帧是有效帧,则进一步对于该当前帧作为验车视频中的帧,是否符合验车视频拍摄规则。在当前帧无效,或者不符合验车视频拍摄规则的情况下,可以及时向用户提供拍摄引导策略。如此,可以使得普通用户能够正确拍摄有效的验车视频,提高用户体验,以及验车效率。
-
公开(公告)号:CN110738576A
公开(公告)日:2020-01-31
申请号:CN201910975009.7
申请日:2019-10-14
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例提供一种为受损车辆生成定损文件的方法和装置,根据一个实施方式,首先获取基于受损车辆的现场视频确定的受损部件标注结果和损伤程度标注结果,其中,受损部件标注结果指示出受损部件和损伤区域,受损程度标注结果是基于受损部件标注结果,对各个受损部件的损伤程度的识别结果,接着,至少将受损部件标注结果和受损程度标注结果输入预先训练的定损模型,其中,定损模型基于多个定损人员的历史定损数据和/或多个维修人员的历史维修数据而训练,用于生成损伤维修方案,然后,基于定损模型的输出结果,为受损车辆生成定损文件。如此,可以提高车辆定损的有效性。
-
公开(公告)号:CN110650292A
公开(公告)日:2020-01-03
申请号:CN201911046418.5
申请日:2019-10-30
Applicant: 支付宝(杭州)信息技术有限公司
IPC: H04N5/232
Abstract: 本说明书实施例提供了辅助用户拍摄车辆视频的方法和装置,一方面,对于所拍摄的视频中的单个帧,可以实时检测其作为图像的有效性。如果单个帧是有效帧,则进一步对于该当前帧作为验车视频中的帧,是否符合验车视频拍摄规则。在当前帧无效,或者不符合验车视频拍摄规则的情况下,可以及时向用户提供拍摄引导策略。如此,可以使得普通用户能够正确拍摄有效的验车视频,提高用户体验,以及验车效率。
-
公开(公告)号:CN118155016A
公开(公告)日:2024-06-07
申请号:CN202410303824.X
申请日:2024-03-15
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06V10/774 , G06V10/74 , G06V10/764 , G06N3/08
Abstract: 本说明书实施例提供一种用于模型训练的数据集的构建方法和装置,方法包括:获取第一数据集,包括若干组初始图文对;针对第一数据集中的任一组初始图文对,计算其包括的初始图片和初始文本的相似度得分;根据相似度得分和预先设定的分数阈值,将第一数据集中的各组初始图文对划分为高质数据、中质数据和低质数据;针对属于中质数据的任一组初始图文对,提取其包括的初始图片,根据该初始图片生成对应的文本描述,利用初始图片和对应的文本描述组成一组更新图文对;将各组更新图文对和属于高质数据的各组初始图文对加入第二数据集,第二数据集作为用于模型训练的数据集。能够获取足够数量的满足要求的训练数据,从而提升模型的训练效果。
-
公开(公告)号:CN113038018B
公开(公告)日:2022-06-28
申请号:CN202110313504.9
申请日:2019-10-30
Applicant: 支付宝(杭州)信息技术有限公司
IPC: H04N5/232
Abstract: 本说明书实施例提供了辅助用户拍摄车辆视频的方法和装置,一方面,对于所拍摄的视频中的单个帧,可以实时检测其作为图像的有效性。如果单个帧是有效帧,则进一步对于该当前帧作为验车视频中的帧,是否符合验车视频拍摄规则。在当前帧无效,或者不符合验车视频拍摄规则的情况下,可以及时向用户提供拍摄引导策略。如此,可以使得普通用户能够正确拍摄有效的验车视频,提高用户体验,以及验车效率。
-
公开(公告)号:CN113609316A
公开(公告)日:2021-11-05
申请号:CN202110850911.3
申请日:2021-07-27
Applicant: 支付宝(杭州)信息技术有限公司 , 蚂蚁区块链科技(上海)有限公司
IPC: G06F16/483 , G06F16/45 , G06K9/62
Abstract: 本说明书实施例提供了一种媒体内容相似度的检测方法和装置。该方法和装置可以应用于区块链技术中的版权保护。该方法包括:对目标媒体内容进行采样,得到基础帧数据;根据所述基础帧数据,确定目标媒体内容中的各个关键帧;确定参考媒体内容;得到预先确定的参考媒体内容中的各个关键帧;针对目标媒体内容的每一个关键帧,计算该关键帧与参考媒体内容中各个关键帧的各帧间相似度;根据计算出的各帧间相似度,确定目标媒体内容与参考媒体内容的整体相似度。该方法减少了计算量和存储量,同时也提升了检测的准确率。
-
公开(公告)号:CN111737522B
公开(公告)日:2021-03-02
申请号:CN202010816354.9
申请日:2020-08-14
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/75 , G06F16/783 , G06F21/10 , G06F16/27 , G06F21/60 , G06F21/64 , G06K9/62 , G06N3/04 , G06N3/08
Abstract: 本说明书公开了一种视频匹配方法、基于区块链的侵权存证方法和装置,该基于区块链的侵权存证方法包括:获取目标视频的多个特征向量;基于所述目标视频的多个特征向量,从视频数据库中检索与所述目标视频相似的候选视频;基于所述目标视频和所述候选视频,构建所述目标视频和所述候选视频之间的时域相似度矩阵特征图;将所述时域相似度矩阵特征图作为深度学习检测模型的输入,以输出所述候选视频中与所述目标视频相匹配的视频片段和对应的相似度;当相似度大于或等于预设相似度阈值时,将包含有所述目标视频的摘要、所述候选视频中与所述目标视频相匹配的视频片段和对应的相似度的侵权证据上传至区块链中。
-
公开(公告)号:CN111737522A
公开(公告)日:2020-10-02
申请号:CN202010816354.9
申请日:2020-08-14
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/75 , G06F16/783 , G06F21/10 , G06F16/27 , G06F21/60 , G06F21/64 , G06K9/62 , G06N3/04 , G06N3/08
Abstract: 本说明书公开了一种视频匹配方法、基于区块链的侵权存证方法和装置,该基于区块链的侵权存证方法包括:获取目标视频的多个特征向量;基于所述目标视频的多个特征向量,从视频数据库中检索与所述目标视频相似的候选视频;基于所述目标视频和所述候选视频,构建所述目标视频和所述候选视频之间的时域相似度矩阵特征图;将所述时域相似度矩阵特征图作为深度学习检测模型的输入,以输出所述候选视频中与所述目标视频相匹配的视频片段和对应的相似度;当相似度大于或等于预设相似度阈值时,将包含有所述目标视频的摘要、所述候选视频中与所述目标视频相匹配的视频片段和对应的相似度的侵权证据上传至区块链中。
-
-
-
-
-
-
-
-
-