-
公开(公告)号:CN115210716A
公开(公告)日:2022-10-18
申请号:CN202180017962.6
申请日:2021-01-23
Applicant: 华为技术有限公司
Inventor: 池志祥 , 拉苏尔·穆罕默德·纳西里 , 刘铮 , 唐进 , 吕炬炜
IPC: G06N3/04
Abstract: 提供了用于多帧视频帧插值的系统和方法。高阶运动建模,如三阶运动建模,通过松弛初始光流估计中使用的损失函数所施加的约束,实现了多个插值帧之间的中间光流的预测。时间金字塔光流修正模块对用于生成中间帧的光流图进行粗到细修正,从而将成比例更多的修正注意力集中到高误差中间帧的光流图上。时间金字塔像素修正模块对生成的中间帧进行粗到细修正,从而将成比例更多的修正注意力集中到所述高误差中间帧上。生成式对抗网络(generative adversarial network,GAN)模块计算用于训练在光流估计模块、时间金字塔光流修正模块和/或时间金字塔像素修正模块中使用的神经网络的损失函数。
-
公开(公告)号:CN114342353A
公开(公告)日:2022-04-12
申请号:CN202080062449.4
申请日:2020-09-09
Applicant: 华为技术有限公司
IPC: H04N5/262
Abstract: 描述了用于视频分割和场景识别的方法和系统。接收具有多个帧的视频以及与所述视频相关联的字幕文件。对所述视频执行分割,以基于所述视频的所述帧中特征的逐帧比较生成包括一个或多个视频帧的第一组视频帧。所述第一视频帧中的每个视频帧包括帧指示器,所述帧指示器至少指示视频帧的第一起始帧。解析与所述视频相关联的所述字幕文件,以基于所述字幕文件中的每个对话的起始时间和结束时间生成一个或多个字幕片段;基于所述第一组视频帧中的所述视频帧和所述一个或多个字幕片段,生成包括一个或多个第二视频帧的第二组视频帧。所述第二组视频片段包括至少一个合并视频片段,所述合并视频片段通过合并所述第一组视频片段中对应于公共字幕片段的两个或多个视频片段生成。
-
公开(公告)号:CN113807183A
公开(公告)日:2021-12-17
申请号:CN202110945460.1
申请日:2021-08-17
Applicant: 华为技术有限公司
Abstract: 本申请提供了一种模型训练方法及相关设备。涉及人工智能领域,具体涉及计算机视觉领域。该方法包括:利用第二图像训练反事实特征生成器,利用特征提取器对第一图像进行特征提取以得到提取特征向量;利用反事实特征生成器对第一图像的真实标签和第一随机噪声向量进行处理得到训练对象的反事实特征向量;利用预测器对提取特征向量和反事实特征向量进行处理得到第一图像的预测标签;根据第一图像的真实标签、预测标签、提取特征向量和反事实特征向量调整神经网络模型的网络参数,以得到领域迁移后的神经网络模型。利用反事实特征向量干预源领域数据集的训练过程,使训练后的特征提取器更关注训练对象的内容特征,提升模型在跨领域场景下的泛化性能。
-
公开(公告)号:CN115298638A
公开(公告)日:2022-11-04
申请号:CN202080098779.9
申请日:2020-03-23
Applicant: 华为技术有限公司
IPC: G06F3/01
Abstract: 本发明描述了用于基于手势控制设备的方法和系统。处理输入帧以确定所述输入帧中的显著的解剖学特征的位置。基于所述显著的解剖学特征的所述位置定义虚拟手势空间,所述虚拟手势空间是用于检测手势输入的定义的空间。仅在所述虚拟手势空间中处理所述输入帧,以检测和跟踪手。使用通过检测和跟踪至少一只手生成的信息,为所述至少一只手确定手势类别。所述设备可以是智能电视、智能手机、平板电脑等。
-
公开(公告)号:CN114556370A
公开(公告)日:2022-05-27
申请号:CN202080073284.0
申请日:2020-11-12
Applicant: 华为技术有限公司
Inventor: 尼亚穆尔·夸德尔 , 马德·易卜拉欣·哈利勒 , 吕炬炜 , 戴鹏 , 李维
IPC: G06N3/04
Abstract: 描述了用于更新神经网络的卷积层的一组卷积核的权重的方法和系统。基于所述权重的特征,使用注意力机制来生成一组具有注意力注入权重的卷积核。例如,将一组基于位置的注意力乘数应用于所述一组卷积核中的权重,将基于大小的注意力函数应用于所述一组卷积核中的所述权重,或者两者兼有。使用所述具有注意力注入权重的一组卷积核来生成输出激活图。计算所述神经网络的损失,并反向传播梯度,以更新所述卷积核的所述注意力注入权重。
-
公开(公告)号:CN112805996A
公开(公告)日:2021-05-14
申请号:CN201880098548.0
申请日:2018-10-08
Applicant: 华为技术有限公司
IPC: H04N5/91
Abstract: 本发明描述了用于生成慢动作视频片段的方法和设备。第一视频帧集以第一分辨率和第一帧率呈现视频视图。第二视频帧集以第二分辨率和第二帧率呈现所述视频视图,其中,所述第二分辨率低于所述第一分辨率,且所述第二集合的至少一部分的所述第二帧率高于所述第一帧率。在所述第一集合中识别出至少两个高分辨率帧,以生成所述慢动作视频片段。在所述第二集合中识别与已识别的高分辨率帧之间的帧间时间段对应的一个或多个低分辨率帧。通过使用插值法基于已识别的高分辨率帧和已识别的低分辨率帧生成与所述帧间时间段对应的至少一个高分辨率帧来生成所述慢动作视频片段。
-
公开(公告)号:CN118633085A
公开(公告)日:2024-09-10
申请号:CN202280087808.0
申请日:2022-01-06
Applicant: 华为技术有限公司
Inventor: 姆德易卜拉欣·哈利勒 , 戴鹏 , 梁汉文 , 陈立哲 , 瓦尔山斯·拉文德拉·拉奥 , 吕炬炜 , 许松岑
IPC: G06F16/75
Abstract: 公开了用于从视频生成定制视频片段的方法和设备。所述视频被划分成视频片段。对于每个相应视频片段,计算相应分数集合,其中,每个分数表示所述相应视频片段中的相应内容特征。通过向每个相应分数集合应用公共权重值集合来计算每个相应视频片段的相应加权总分。输出选择的视频片段作为所述定制视频片段,其中,所述选择的视频片段是从具有排名靠前加权总分的一个或多个排名靠前视频片段中选择的。
-
公开(公告)号:CN114342353B
公开(公告)日:2023-07-18
申请号:CN202080062449.4
申请日:2020-09-09
Applicant: 华为技术有限公司
IPC: H04N5/262
Abstract: 描述了用于视频分割和场景识别的方法和系统。接收具有多个帧的视频以及与所述视频相关联的字幕文件。对所述视频执行分割,以基于所述视频的所述帧中特征的逐帧比较生成包括一个或多个视频帧的第一组视频帧。所述第一视频帧中的每个视频帧包括帧指示器,所述帧指示器至少指示视频帧的第一起始帧。解析与所述视频相关联的所述字幕文件,以基于所述字幕文件中的每个对话的起始时间和结束时间生成一个或多个字幕片段;基于所述第一组视频帧中的所述视频帧和所述一个或多个字幕片段,生成包括一个或多个第二视频帧的第二组视频帧。所述第二组视频片段包括至少一个合并视频片段,所述合并视频片段通过合并所述第一组视频片段中对应于公共字幕片段的两个或多个视频片段生成。
-
公开(公告)号:CN112805996B
公开(公告)日:2022-04-22
申请号:CN201880098548.0
申请日:2018-10-08
Applicant: 华为技术有限公司
IPC: H04N5/91
Abstract: 本发明描述了用于生成慢动作视频片段的方法和设备。第一视频帧集以第一分辨率和第一帧率呈现视频视图。第二视频帧集以第二分辨率和第二帧率呈现所述视频视图,其中,所述第二分辨率低于所述第一分辨率,且所述第二集合的至少一部分的所述第二帧率高于所述第一帧率。在所述第一集合中识别出至少两个高分辨率帧,以生成所述慢动作视频片段。在所述第二集合中识别与已识别的高分辨率帧之间的帧间时间段对应的一个或多个低分辨率帧。通过使用插值法基于已识别的高分辨率帧和已识别的低分辨率帧生成与所述帧间时间段对应的至少一个高分辨率帧来生成所述慢动作视频片段。
-
-
-
-
-
-
-
-