-
公开(公告)号:CN111291759A
公开(公告)日:2020-06-16
申请号:CN202010055009.8
申请日:2020-01-17
Applicant: 北京三快在线科技有限公司
Abstract: 本申请实施例公开了一种文字检测方法、装置、电子设备及存储介质,该方法包括:将待检测图像输入卷积神经网络,提取多层级特征;根据所述多层级特征,生成金字塔特征;针对所述金字塔特征的每层特征图,提取各个特征点之间的关联关系,得到相关性金字塔特征;确定所述相关性金字塔特征中每层相关性特征图对应的文字边界框;根据每层相关性特征图对应的文字边界框,确定所述待检测图像中的文字边界框。本申请实施例通过提取金字塔特征中每层特征图各个特征点之间的关联关系,得到的相关性金字塔特征中包括了全局信息,从而结合全局信息和局部信息,可以减少特征点回归错误的情况,从而可以提高检测结果的准确性。
-
公开(公告)号:CN109389032B
公开(公告)日:2020-06-12
申请号:CN201810983728.9
申请日:2018-08-27
Applicant: 北京三快在线科技有限公司
Abstract: 本公开的实施例提供了一种图片真实性的确定方法、装置、电子设备及可读存储介质,所述方法包括:从至少两张目标图片中检测目标区域,所述目标区域为所述目标图片中具有同一拍摄对象的区域;在从所述目标图片中均检测到目标区域的情况下,针对所述目标区域建立三维空间得到组成所述三维空间的点集;采用所述点集进行平面拟合得到参考平面;通过所述参考平面以及所述点集确定所述目标图片的真实性。可以通过图片的三维模型拟合出平面,并判断图片的真实性,工作量较小,有助于识别各种图片的真实性。
-
公开(公告)号:CN110738602A
公开(公告)日:2020-01-31
申请号:CN201910866716.2
申请日:2019-09-12
Applicant: 北京三快在线科技有限公司
Abstract: 本申请实施例提供了一种图像处理方法、装置、电子设备及可读存储介质,旨在降低文字识别结果的错误率。所述方法包括:对待处理图像进行目标区域检测,得到所述待处理图像上包含文本图像的目标区域;根据所述包含文本图像的目标区域,对所述待处理图像进行剪裁,得到包含所述文本图像的子图像;对所述子图像中的所述文本图像进行角点预测,得到所述文本图像的角点位置信息;根据所述文本图像的角点位置信息,确定针对所述文本图像的矫正参数,并根据所述矫正参数对所述文本图像进行投影矫正,获得投影矫正后的目标文本图像;对所述目标文本图像进行文字识别,获得该本文图像中的文字信息。
-
公开(公告)号:CN110135245A
公开(公告)日:2019-08-16
申请号:CN201910263456.X
申请日:2019-04-02
Applicant: 北京三快在线科技有限公司
Abstract: 本公开公开了一种到店确认方法,包括:获取用户上传的实时位置信息和第一门脸图像;根据所述第一门脸图像以及所述实时位置信息对应的候选商家名称,确认所述用户当前所在实际商家的第一商家名称;检测所述第一商家名称是否与所述用户当前对应的目标商家的第二商家名称相匹配,以及检测所述第一门脸图像是否与所述目标商家的第二门脸图像相匹配,并根据检测结果确认所述用户是否到达所述目标商家。解决了到店确认不准确的技术问题。取得了提高到店检测准确性的有益效果。
-
公开(公告)号:CN109903294A
公开(公告)日:2019-06-18
申请号:CN201910074954.X
申请日:2019-01-25
Applicant: 北京三快在线科技有限公司
Abstract: 本申请实施例提供了一种图像处理方法、装置、电子设备及可读存储介质。所述方法包括:对原始图像进行灰度处理,以得到灰度图像;将所述灰度图像划分为多个区块;从所述多个区块中确定多个目标区块;根据所述多个区块中每个区块上各个像素点的灰度值之间的差异程度,从所述多个区块中确定多个目标区块;将多个目标像素点各自的灰度值分别输入预设函数,得到所述预设函数输出的多个映射系数;将所述多个映射系数与所述多个目标像素点各自的灰度值分别对应相乘,得到所述多个目标像素点的映射后的灰度值;根据所述多个目标像素点的映射后的灰度值,提取所述原始图像的前景。
-
公开(公告)号:CN109635810A
公开(公告)日:2019-04-16
申请号:CN201811320546.X
申请日:2018-11-07
Applicant: 北京三快在线科技有限公司
Abstract: 本公开实施例提供一种确定文本信息的方法、装置、设备及存储介质,其中,所述方法包括:获得待识别版面图像以及所述待识别版面图像的单字识别结果;基于所述单字识别结果确定所述待识别版面图像中的候选文字串;提取所述候选文字串中关联关系的特征值,所述关联关系基于所述候选文字串对应的单字识别结果确定;基于所述特征值从所述候选文字串中确定最终文字串,所述最终文字串用于表征所述待识别版面信息中文本信息的识别结果。本公开实施例可以基于版面图像的单字识别结果确定版面图像中的文本信息,提升识别版面图像的文本信息的准确性。
-
公开(公告)号:CN108460414A
公开(公告)日:2018-08-28
申请号:CN201810164081.7
申请日:2018-02-27
Applicant: 北京三快在线科技有限公司
Abstract: 本发明提供一种训练样本图像的生成方法、装置及电子设备,所述方法包括:从若干原始样本图像中识别出背景图像特征和前景图像特征;从前景图像特征中分离出若干前景特征单元;基于所述前景特征单元和所述背景图像特征组合生成若干目标样本图像;通过向所述目标样本图像中添加干扰特征参数,生成多个训练样本图像,所述干扰特征参数用于模拟拍摄真实样本的拍摄效果的特征参数。本发明根据原始样本图像分离出的背景图像特征和前景特征单元组合生成大量的目标样本图像,通过向所述目标样本图像中添加干扰特征参数,生成多个训练样本图像,从而可以简单高效的获取大量训练样本图像。
-
公开(公告)号:CN113947556B
公开(公告)日:2025-02-25
申请号:CN202111151810.3
申请日:2021-09-29
Applicant: 北京三快在线科技有限公司
Abstract: 本申请公开了一种图像增强方法、装置、设备及存储介质,属于图像处理技术领域。方法包括:获取多组成对样本数据和多组非成对样本数据,每组成对样本数据包括图像内容相同但图像质量不同的两个图像,每组非成对样本数据包括图像内容和图像质量均不同的两个图像,且所述多组非成对样本数据包括多个领域的图像;基于所述多组成对样本数据和所述多组非成对样本数据,对图像增强模型进行训练,得到训练后的所述图像增强模型;在获取到待增强图像的情况下,通过训练后的所述图像增强模型对所述待增强图像进行图像增强,得到增强后的图像。该方案能够使得图像增强模型生成保真度较高的图像,且提高了图像增强模型的泛化能力。
-
公开(公告)号:CN111325205B
公开(公告)日:2023-10-10
申请号:CN202010136041.9
申请日:2020-03-02
Applicant: 北京三快在线科技有限公司
IPC: G06V30/40 , G06V30/146 , G06V10/774 , G06V10/80 , G06V30/19
Abstract: 本申请公开了文档图像方向识别方法、装置及模型的训练方法、装置。文档图像识别模型的训练方法包括:根据注意力机制,生成训练图像的注意力裁剪图像和注意力抹除图像,以及分别确定训练图像、注意力裁剪图像以及注意力抹除图像各自的注意力融合特征;根据各注意力融合特征分别识别相应图像的方向,得到相应的识别结果;根据各识别结果计算交叉熵损失值,以及根据各注意力融合特征计算中心损失值,根据交叉熵损失值和中心损失值对文档图像方向识别模型进行参数优化或停止训练。利用注意力裁剪和注意力抹除,让文档图像方向识别模型更容易聚焦至文档图像中有区分度的文字部分特征,并且通过减少类内距离,达到了更好的通用文档图像方向判断效果。
-
公开(公告)号:CN111680691B
公开(公告)日:2023-06-02
申请号:CN202010365284.X
申请日:2020-04-30
Applicant: 北京三快在线科技有限公司
IPC: G06V30/148 , G06V30/19 , G06N3/0464
Abstract: 本申请公开了一种文字检测方法、装置、电子设备和计算机可读存储介质,所述方法包括:对待检测图像进行单字检测,得到单字视觉特征和单字位置信息,根据所述单字视觉特征和所述单字位置信息,确定单字连接关系,根据所述单字连接关系确定序列化的文字检测结果。本申请通过借助卷积神经网络的强大特征表征能力,能够自动学习到单字之间的连接关系,避免了复杂的规则设计,提高了文字检测模型的泛化能力,同时将单字检测和单字连接关系的预测统一到一个框架,复用单字检测过程中生成的视觉特征等信息,避免了低效的人工特征选择方式。
-
-
-
-
-
-
-
-
-