-
公开(公告)号:CN113079420B
公开(公告)日:2024-10-18
申请号:CN202010006953.4
申请日:2020-01-03
Applicant: 北京三星通信技术研究有限公司 , 三星电子株式会社
IPC: H04N21/845 , H04N21/44
Abstract: 本申请实施例提供了一种视频生成方法、装置、电子设备及计算机可读存储介质,该方法包括:提取视频生成请求的意图特征;基于意图特征和候选视频,生成目标视频。基于本申请实施例所提供的方案,可以得到能够更好的反映用户真实意图的目标视频,更好的满足用户的实际需求,提升用户的感知。
-
公开(公告)号:CN119339278A
公开(公告)日:2025-01-21
申请号:CN202310900041.5
申请日:2023-07-20
Applicant: 北京三星通信技术研究有限公司 , 三星电子株式会社
IPC: G06V20/40 , G06V20/70 , G06V10/82 , G06N3/0464 , G06V10/80
Abstract: 本申请实施例提供了一种由电子设备执行的方法、电子设备、存储介质及程序产品,涉及计算机视觉和人工智能等领域,该方法包括:使用人工智能AI网络,获取待处理视频中的行为主体及其相关的事件;基于获取的行为主体,提供行为主体选择界面;接收用户通过所述选择界面选择的行为主体;提供与用户选择的行为主体相关的事件。基于本申请实施例提供的该方法,能够识别出视频中的行为主体及其相关事件,可以更好的满足实际应用需求。
-
公开(公告)号:CN110555433B
公开(公告)日:2024-04-26
申请号:CN201811585134.9
申请日:2018-12-24
Applicant: 北京三星通信技术研究有限公司 , 三星电子株式会社
IPC: G06V20/62 , G06V30/146 , G06V10/82 , G06N3/044 , G06N3/0464
Abstract: 本申请公开了一种图像处理方法、装置、电子设备及计算机可读存储介质,该图像处理方法包括:检测待处理图像对应的文字区域;对所述文字区域进行识别,得到所述文字区域的文字识别结果。本申请中,实现了对待处理图像中的文字识别,简化了对图像中文字的识别方式,提升了对文字的识别效果。
-
公开(公告)号:CN117372911A
公开(公告)日:2024-01-09
申请号:CN202210753534.6
申请日:2022-06-28
Applicant: 北京三星通信技术研究有限公司 , 三星电子株式会社
IPC: G06V20/40 , G06V10/42 , G06V10/44 , G06V10/80 , G06V10/82 , G06N3/0464 , G06N3/045 , G06N3/0442
Abstract: 本申请实施例提供了一种图像处理方法、装置、电子设备及存储介质,该方法包括:获取待处理图像对应的各个第一图像块;通过窗口自注意力网络,将各个第一图像块分为至少两组,并针对每组第一图像块,分别确定每组第一图像块中的第一图像块之间的注意力信息,得到包含局部注意力信息的各个第二图像块;基于各个第二图像块,确定待处理图像的识别结果。其中,由电子设备执行的上述图像处理方法可以使用人工智能模型来执行。本申请实施例通过获得具有局部注意力信息的空间特征,能够实现大幅提升微小动作的识别效果,进而提升识别结果的准确率。
-
公开(公告)号:CN113673289A
公开(公告)日:2021-11-19
申请号:CN202010413347.4
申请日:2020-05-15
Applicant: 北京三星通信技术研究有限公司 , 三星电子株式会社
Abstract: 提供了一种视频处理方法和装置,所述视频处理方法包括:基于视频的时域特征和空域特征,获取视频的第一特征;基于第一特征,获取视频帧属于动作起始时间的概率和属于动作终止时间的概率以及动作提名的置信度;基于视频帧属于动作起始时间的概率和属于动作终止时间的概率、以及动作提名的置信度,获取动作提名。
-
公开(公告)号:CN115376201A
公开(公告)日:2022-11-22
申请号:CN202110557640.2
申请日:2021-05-21
Applicant: 北京三星通信技术研究有限公司 , 三星电子株式会社
Inventor: 王晓冰
Abstract: 提供一种视频动作检测方法及装置。该视频动作检测方法包括:提取视频的时域特征和空域特征;基于时域特征和空域特征生成动作提名特征;对动作提名特征分别在起始时间维度和终止时间维度进行注意力处理,获得从视频中采样出的每个视频帧属于动作起始时间的概率和属于动作终止时间的概率;基于每个时刻属于动作起始时间的概率和属于动作终止时间的概率确定视频中的动作。通过使用该视频动作检测方法及装置,可提高检测视频中动作的起始时间、终止时间的准确性。
-
公开(公告)号:CN110555433A
公开(公告)日:2019-12-10
申请号:CN201811585134.9
申请日:2018-12-24
Applicant: 北京三星通信技术研究有限公司 , 三星电子株式会社
IPC: G06K9/32
Abstract: 本申请公开了一种图像处理方法、装置、电子设备及计算机可读存储介质,该图像处理方法包括:检测待处理图像对应的文字区域;对所述文字区域进行识别,得到所述文字区域的文字识别结果。本申请中,实现了对待处理图像中的文字识别,简化了对图像中文字的识别方式,提升了对文字的识别效果。
-
公开(公告)号:CN113079420A
公开(公告)日:2021-07-06
申请号:CN202010006953.4
申请日:2020-01-03
Applicant: 北京三星通信技术研究有限公司 , 三星电子株式会社
IPC: H04N21/845 , H04N21/44
Abstract: 本申请实施例提供了一种视频生成方法、装置、电子设备及计算机可读存储介质,该方法包括:提取视频生成请求的意图特征;基于意图特征和候选视频,生成目标视频。基于本申请实施例所提供的方案,可以得到能够更好的反映用户真实意图的目标视频,更好的满足用户的实际需求,提升用户的感知。
-
公开(公告)号:CN120047599A
公开(公告)日:2025-05-27
申请号:CN202311585850.8
申请日:2023-11-24
Applicant: 北京三星通信技术研究有限公司 , 三星电子株式会社
Abstract: 本公开实施例提供了一种由电子设备执行的方法和电子设备,涉及人工智能领域。该方法包括:基于多视角图像,确定各空间点在多视角下的2D语义特征;基于各空间点在多视角下的2D语义特征,确定各空间点的第一3D语义特征;基于各空间点的第一3D语义特征,预测各空间点的密度信息;基于各空间点的密度信息,训练3D内容重构模型。可选地,由电子设备执行的上述方法可以使用人工智能模型来执行。
-
公开(公告)号:CN115511721A
公开(公告)日:2022-12-23
申请号:CN202110696653.8
申请日:2021-06-23
Applicant: 北京三星通信技术研究有限公司 , 三星电子株式会社
Abstract: 提供了一种视频修复方法和装置,所述视频修复方法包括:获得具有空洞区域的输入视频的每帧的图像特征;基于当前帧的图像特征和不同于当前帧的至少一个参考帧的图像特征对当前帧中的空洞区域进行填充;基于每帧的填充的图像特征来获得修复视频。
-
-
-
-
-
-
-
-
-