一种图像文字行方向计算方法及装置

    公开(公告)号:CN117789234A

    公开(公告)日:2024-03-29

    申请号:CN202211158886.3

    申请日:2022-09-22

    Abstract: 本发明提供一种图像文字行方向计算方法及装置,该方法包括:获取输入图像,确定输入图像对应的文本区域,将文本区域中满足预设条件的相邻文字作为两个节点,连接两个节点的线段作为无向边,创建文本区域对应的无向图,遍历无向图中的节点和无向边,将任意两条平行且具有共同经过节点的无向边作为一条文本行线段,获取文本行线段集合,根据文本行线段集合,确定输入图像对应的文字行方向信息。通过该方法,能够解决现有图像文字行方向检测方法需要对场景相关的文字行方向数据进行模型训练,流程繁琐且模型普适性不佳的问题。该方法无需训练,实现简单并且能满足实时计算的性能要求。

    一种商品补货情况的检测方法及装置

    公开(公告)号:CN117238074A

    公开(公告)日:2023-12-15

    申请号:CN202311188218.X

    申请日:2023-09-14

    Abstract: 本发明公开了一种商品补货情况的检测方法及装置,涉及计算机视觉领域。该方法包括如下步骤:首先获取零售柜的第一图像和第二图像,对补货前图像中检测到的空货道进行分割与降重,计算货道中商品空缺位置面积占货道面积的比例确定补货前所述零售柜包括的N个货道的N个第一货道信息,并确定补货后的所述零售柜包括的所述N个货道的N个第二货道信息;最后通过根据所述N个第一货道信息与所述N个第二货道信息,获得N个第一信息判断商品补货状态。本发明面向新零售场景中零售柜商品补货任务,能够准确识别零售柜是否进行正确补货,能够提高补货判断的准确率,并提升审核效率。

    图像内容识别方法、装置以及计算机可读存储介质

    公开(公告)号:CN110188748B

    公开(公告)日:2021-07-13

    申请号:CN201910362067.2

    申请日:2019-04-30

    Abstract: 一种图像内容识别方法、装置以及计算机可读存储介质,所述方法包括:定位得到所述目标内容的位置范围后;对所述目标内容的位置范围进行多次调整,针对每次调整后的所述目标内容的位置范围内的内容进行识别,得到多个识别结果;将多个识别结果进行归类,选取识别结果数量最多的类别作为最终识别结果。采用上述方案,在定位目标内容的位置后,通过对目标内容的位置进行多次调整,针对每次调整后的位置进行识别,在识别结果中筛选得到最终识别结果,以提升图像内容识别的准确度。

    一种数据处理方法及装置
    7.
    发明公开

    公开(公告)号:CN117788877A

    公开(公告)日:2024-03-29

    申请号:CN202311591974.7

    申请日:2023-11-27

    Abstract: 本申请实施例提供一种数据处理方法及装置,包括:获取未标注图像集,所述未标注图像集中包含多张未标注图像;基于预设检测方法,获得各未标注图像各自的至少一个目标对象,以及各目标对象各自的分布信息和对象不确定值,分布信息表征目标对象在所属图像中的分布情况,对象不确定值表征目标对象的分布信息的不可信程度;基于各目标对象各自的分布信息,对每个未标注图像的至少一个目标对象的对象不确定值进行加权处理,获得相应未标注图像的图像不确定值,并从未标注图像集中剔除图像不确定值最大的预设数量的未标注图像,获得目标图像;基于目标图像的分布信息,对目标图像进行标注,用以获取标注的图像样本,减少模型训练所耗费的成本。

    图像内容识别方法、装置以及计算机可读存储介质

    公开(公告)号:CN110188748A

    公开(公告)日:2019-08-30

    申请号:CN201910362067.2

    申请日:2019-04-30

    Abstract: 一种图像内容识别方法、装置以及计算机可读存储介质,所述方法包括:定位得到所述目标内容的位置范围后;对所述目标内容的位置范围进行多次调整,针对每次调整后的所述目标内容的位置范围内的内容进行识别,得到多个识别结果;将多个识别结果进行归类,选取识别结果数量最多的类别作为最终识别结果。采用上述方案,在定位目标内容的位置后,通过对目标内容的位置进行多次调整,针对每次调整后的位置进行识别,在识别结果中筛选得到最终识别结果,以提升图像内容识别的准确度。

Patent Agency Ranking