-
公开(公告)号:CN119477715A
公开(公告)日:2025-02-18
申请号:CN202411486755.7
申请日:2024-10-23
Applicant: 上海上湖信息技术有限公司 , 海南上湖信息技术有限公司 , 上海耳序信息技术有限公司
Abstract: 本申请实施例提供一种视频流的处理方法及装置,应用在多媒体资源处理技术领域,包括:获取视频流的任意视频帧,针对视频帧进行检测,确定视频帧存在人脸图像后,分别对人脸图像和视频帧进行超分辨率操作,得到高分辨率人脸图像和高分辨率视频帧;对高分辨率人脸图像和高分辨率视频帧进行融合,得到修复视频帧,根据各修复视频帧,得到修复后的视频流。本申请通过对视频中的人脸部分进行单独的超分辨率处理,并将其结果与对视频帧超分辨率结果进行融合,实现对包含复杂退化的视频进行修复,得到高质量超分辨率的视频流。有效恢复视频流中的细节以提升观感效果,并保持整体视频的高清晰度,解决了现有技术方案中的模糊和细节缺失的问题。
-
公开(公告)号:CN117789234A
公开(公告)日:2024-03-29
申请号:CN202211158886.3
申请日:2022-09-22
Applicant: 上海上湖信息技术有限公司
IPC: G06V30/414 , G06V30/19
Abstract: 本发明提供一种图像文字行方向计算方法及装置,该方法包括:获取输入图像,确定输入图像对应的文本区域,将文本区域中满足预设条件的相邻文字作为两个节点,连接两个节点的线段作为无向边,创建文本区域对应的无向图,遍历无向图中的节点和无向边,将任意两条平行且具有共同经过节点的无向边作为一条文本行线段,获取文本行线段集合,根据文本行线段集合,确定输入图像对应的文字行方向信息。通过该方法,能够解决现有图像文字行方向检测方法需要对场景相关的文字行方向数据进行模型训练,流程繁琐且模型普适性不佳的问题。该方法无需训练,实现简单并且能满足实时计算的性能要求。
-
公开(公告)号:CN117765463A
公开(公告)日:2024-03-26
申请号:CN202311724013.9
申请日:2023-12-14
Applicant: 上海上湖信息技术有限公司
IPC: G06V20/52 , G06V20/40 , G06V10/25 , G06V10/46 , G06V10/62 , G06V10/74 , G06V10/82 , G06N3/0464 , G06T7/246 , G06T7/277 , H04N7/18 , G07F9/00
Abstract: 本申请提供一种智能售货柜控制方法和装置、设备及存储介质,该方案可应用于售货柜,在售货柜获取售货柜的图像采集装置采集的多媒体数据后,基于多媒体数据获取各商品的运动轨迹和各商品在各帧图像对应的检测框,其中,第X个商品的检测框指示第X个商品相对于图像采集装置所在的水平面的旋转角度、第X个商品的中心点、第X个商品的宽度以及第X个商品的高度;根据各商品在第i帧图像对应的检测框以及各商品的运动轨迹预测各商品在第i+1帧图像对应的预测框,并将各商品在第i+1帧图像对应的检测框与预测框分别进行匹配,确定出柜的商品信息。该方法构造的检测框指示旋转角度,可以使得检测框更加贴合商品,进而可提高商品检测准确率。
-
公开(公告)号:CN119832019A
公开(公告)日:2025-04-15
申请号:CN202411881398.4
申请日:2024-12-19
Applicant: 上海上湖信息技术有限公司 , 海南上湖信息技术有限公司 , 上海耳序信息技术有限公司
IPC: G06T7/194 , G06T7/11 , G06T7/269 , G06T5/77 , G06T5/50 , G06N3/0464 , G06N3/0455 , G06N3/044 , G06V20/40 , G06V10/25 , G06V20/62 , G06V30/146 , G06V10/82
Abstract: 本申请实施例提供一种视频流中前景目标的移除方法及装置,应用在计算机技术领域,包括:从原始视频流中检测出具有前景目标的视频帧,并为具有前景目标的视频帧生成前景目标对应的掩码;针对任意具有前景目标的视频帧进行移除修复操作,得到修复视频帧;根据各修复视频帧得到修复视频流;移除修复操作包括:根据掩码对具有前景目标的视频帧进行前景目标移除,得到待修复视频帧;计算具有前景目标的视频帧的前向光流和后向光流,通过前向光流和后向光流对待修复视频帧进行像素填充;对像素填充后的待修复视频帧,通过前向光流和后向光流进行像素对齐,得到修复视频帧。本申请确保了在动态场景或多前景目标场景下视频的准确性和视觉一致性。
-
公开(公告)号:CN117238074A
公开(公告)日:2023-12-15
申请号:CN202311188218.X
申请日:2023-09-14
Applicant: 上海上湖信息技术有限公司
Abstract: 本发明公开了一种商品补货情况的检测方法及装置,涉及计算机视觉领域。该方法包括如下步骤:首先获取零售柜的第一图像和第二图像,对补货前图像中检测到的空货道进行分割与降重,计算货道中商品空缺位置面积占货道面积的比例确定补货前所述零售柜包括的N个货道的N个第一货道信息,并确定补货后的所述零售柜包括的所述N个货道的N个第二货道信息;最后通过根据所述N个第一货道信息与所述N个第二货道信息,获得N个第一信息判断商品补货状态。本发明面向新零售场景中零售柜商品补货任务,能够准确识别零售柜是否进行正确补货,能够提高补货判断的准确率,并提升审核效率。
-
公开(公告)号:CN110188748B
公开(公告)日:2021-07-13
申请号:CN201910362067.2
申请日:2019-04-30
Applicant: 上海上湖信息技术有限公司
IPC: G06K9/32
Abstract: 一种图像内容识别方法、装置以及计算机可读存储介质,所述方法包括:定位得到所述目标内容的位置范围后;对所述目标内容的位置范围进行多次调整,针对每次调整后的所述目标内容的位置范围内的内容进行识别,得到多个识别结果;将多个识别结果进行归类,选取识别结果数量最多的类别作为最终识别结果。采用上述方案,在定位目标内容的位置后,通过对目标内容的位置进行多次调整,针对每次调整后的位置进行识别,在识别结果中筛选得到最终识别结果,以提升图像内容识别的准确度。
-
公开(公告)号:CN117788877A
公开(公告)日:2024-03-29
申请号:CN202311591974.7
申请日:2023-11-27
Applicant: 上海上湖信息技术有限公司
IPC: G06V10/764 , G06V10/74 , G06V10/25 , G06V10/77 , G06V10/82 , G06N3/0464
Abstract: 本申请实施例提供一种数据处理方法及装置,包括:获取未标注图像集,所述未标注图像集中包含多张未标注图像;基于预设检测方法,获得各未标注图像各自的至少一个目标对象,以及各目标对象各自的分布信息和对象不确定值,分布信息表征目标对象在所属图像中的分布情况,对象不确定值表征目标对象的分布信息的不可信程度;基于各目标对象各自的分布信息,对每个未标注图像的至少一个目标对象的对象不确定值进行加权处理,获得相应未标注图像的图像不确定值,并从未标注图像集中剔除图像不确定值最大的预设数量的未标注图像,获得目标图像;基于目标图像的分布信息,对目标图像进行标注,用以获取标注的图像样本,减少模型训练所耗费的成本。
-
公开(公告)号:CN110188748A
公开(公告)日:2019-08-30
申请号:CN201910362067.2
申请日:2019-04-30
Applicant: 上海上湖信息技术有限公司
IPC: G06K9/32
Abstract: 一种图像内容识别方法、装置以及计算机可读存储介质,所述方法包括:定位得到所述目标内容的位置范围后;对所述目标内容的位置范围进行多次调整,针对每次调整后的所述目标内容的位置范围内的内容进行识别,得到多个识别结果;将多个识别结果进行归类,选取识别结果数量最多的类别作为最终识别结果。采用上述方案,在定位目标内容的位置后,通过对目标内容的位置进行多次调整,针对每次调整后的位置进行识别,在识别结果中筛选得到最终识别结果,以提升图像内容识别的准确度。
-
-
-
-
-
-
-