-
公开(公告)号:CN112183250B
公开(公告)日:2025-01-03
申请号:CN202010963512.3
申请日:2020-09-14
Applicant: 北京三快在线科技有限公司
IPC: G06V30/414 , G06V30/14 , G06V30/146 , G06V30/148 , G06V30/19
Abstract: 本公开涉及一种文字识别方法、装置、存储介质及电子设备,该方法包括:通过对待识别图像中的文字进行定位检测,得到所述待识别图像中的文字框,其中,每一所述文字框中的文字具有同一行文方向;针对每一所述文字框,确定该文字框中文字的所述行文方向;并根据该文字框的所述行文方向,得到该文字框的文字识别结果。采用这种方法,不管待识别图像中的文字是何种字体类型、字号大小,也不管该待识别图像中的文字是何种行文方向以及采用了何种排版方式,都能检测得到该待识别图像中的文字框,并可以根据检测到的每一文字框的行文方向,得到对应行文方向的文字识别结果。因此这种方法可以针对任意版式的图像进行文字识别。
-
公开(公告)号:CN114417108A
公开(公告)日:2022-04-29
申请号:CN202111621546.5
申请日:2021-12-23
Applicant: 北京三快在线科技有限公司
IPC: G06F16/953 , G06F40/30
Abstract: 本发明实施例提供了一种文本内容的位置预测方法和装置,其中,所述方法包括:获取包含条状的文本内容区域的图像;提取出文本内容区域的第一语义特征,根据第一语义特征提取出文本内容区域的第二语义特征;分别对第二语义特征进行条形池化处理和特征加权处理得到文本内容区域的位置信息。本发明实施例对第一语义特征进行二次提取得到第二语义特征,可以获取更加细化的边缘信息,提升了语义分割结果,进而提高文本内容的位置预测的准确度。对第二语义特征进行条形池化处理,捕获空间区域的长依赖关系,防止无关区域的干扰。对第二语义特征进行特征加权处理,增强文本内容的特征,同时聚合全局和局部的上下文信息,增强长文本内容的位置预测能力。
-
公开(公告)号:CN114283312A
公开(公告)日:2022-04-05
申请号:CN202111670232.4
申请日:2021-12-31
Applicant: 北京三快在线科技有限公司
IPC: G06V10/774 , G06V10/22 , G06V10/80 , G06N20/00
Abstract: 本说明书提供了一种模型训练方法,通过待训练模型中的编码端和主解码端对有标签的第一训练样本和无标签的第二训练样本进行处理,得到第一文字行识别结果和第二文字行识别结果,随后对编码端从第二训练样本中提取出的第二特征进行加扰,得到带扰特征,并根据带扰特征得到带扰识别结果,将第一文字行识别结果与第一训练样本的标签之间的差异确定为第一差异,将第二文字行识别结果与带扰识别结果之间的差异确定为第二差异,根据第一差异和第二差异得到最终差异,并以最终差异最小化为优化目标,对编码端的参数进行调整。本方法通过对第二特征进行加扰的方式,使大量无标签训练样本得以利用,加强了训练出的模型的抗干扰能力,有效提高了模型的性能。
-
公开(公告)号:CN113688832A
公开(公告)日:2021-11-23
申请号:CN202110993903.4
申请日:2021-08-27
Applicant: 北京三快在线科技有限公司
Abstract: 本说明书公开了一种模型训练及图像处理方法、装置。通过待训练的图像处理模型的第一模型中的对待处理图像进行处理并输出已处理图像,并且采用图像处理模型中的第二模型来预测已处理图像中各已处理区域与对应的标注图像的标注区之间的预测差异度,以根据预测差异度来为各已处理区域确定出区域权重,并通过以区域权重加权后的已处理图像和标注图像之间真实的标注差异度的最小为目标调整图像处理模型中的参数。使得在训练的过程中能够对预测差异度较大的区域投入更多的关注,从而避免待处理图像中需要进行处理的区域较小而导致模型训练得到较小的损失时所输出的已处理图像在需要处理的区域仍然难以得到较好的处理。
-
公开(公告)号:CN111898484A
公开(公告)日:2020-11-06
申请号:CN202010675753.8
申请日:2020-07-14
Applicant: 华中科技大学 , 北京三快在线科技有限公司
Abstract: 本公开涉及一种生成模型的方法、装置、可读存储介质及电子设备。方法包括:获取初始模型的至少一个目标初始网络层各自的初始参数矩阵和压缩比例;针对每一目标初始网络层,根据目标初始网络层的初始参数矩阵和压缩比例,对目标初始网络层进行压缩,以得到样本模型;获取样本数据集;根据样本数据集,对样本模型进行训练,以得到应用在样本数据集所属场景下的目标模型。如此,可以利用取值范围为大于0小于1的压缩比例对目标初始网络层进行压缩,使得压缩后的目标样本网络层中的参数数量小于初始网络层中的参数数量,进而减少了由目标样本网络层构成的样本模型的参数数量,使得目标模型的体积较小,有效地改善了目标模型的性能。
-
公开(公告)号:CN111860516B
公开(公告)日:2024-10-18
申请号:CN202010583305.5
申请日:2020-06-23
Applicant: 北京三快在线科技有限公司
IPC: G06V20/62 , G06V30/148 , G06V30/19 , G06F16/9535
Abstract: 本申请实施例提供了商家名称确定方法、装置、服务器及存储介质,该方法包括:基于对商家的门脸图像中的文字进行文字识别得到的识别结果,获取多个候选商家名称中的每一个候选商家名称的多维特征信息,多维特征信息包括:候选商家名称对应的文字识别准确率、候选商家名称与识别结果的相似度、候选商家名称对应的招牌名称概率信息中的至少一个;基于每一个候选商家名称的多维特征信息,计算每一个候选商家名称的置信度,基于每一个候选商家名称的置信度,确定商家的名称。同时考虑了候选商家名称中的匹配文字的识别准确率、候选商家名称与识别结果的相似度、候选商家名称中的匹配文字属于商家的招牌名称的概率,提升确定出的商家的名称的准确性。
-
公开(公告)号:CN114676044A
公开(公告)日:2022-06-28
申请号:CN202210203066.5
申请日:2022-03-03
Applicant: 北京三快在线科技有限公司
Abstract: 本说明书公开了一种软件启动时长测试方法及装置,预先录制了待测试软件的启动过程的视频,作为目标视频,根据预设的启动标准,对从目标视频中提取出的至少部分视频帧中包含的内容进行识别。当确定出目标视频中存在符合启动标准的视频帧时,根据符合启动标准的视频帧对应的时刻,确定待测试软件的启动时长。本方法避免了人工逐帧处理,节省了人工成本,提高了测试效率,另外,无需获取各个软件的源代码,因此,也就无需通过对各个软件的源代码处理的方式来获取软件的启动时长,由于软件启动的各种操作均可对其进行视频录制,不受操作系统的限制,从而提高了适用性以及通用性。
-
公开(公告)号:CN114495084A
公开(公告)日:2022-05-13
申请号:CN202210055233.6
申请日:2022-01-18
Applicant: 北京三快在线科技有限公司
IPC: G06V20/62 , G06V10/26 , G06V30/148
Abstract: 本申请实施例提供了信息获取方法、装置、电子设备及存储介质,该方法包括:在终端显示目标页面的情况下,获取目标页面的图像,以及去除目标页面的图像中的待去除对象,得到待检测图像;利用文字行检测模型检测待检测图像中的文字行,得到文字行检测结果;基于文字行检测结果,确定待检测图像的文字区域,确定待检测图像的白色像素区域;基于文字区域的面积和白色像素区域的面积,生成第一检测结果。对于任意一个型号的终端和任意一个目标页面,均可以自动检测在该终端显示页面的情况下,是否存在显示异常情况,节省确定在终端显示页面的情况下,是否存在显示异常情况的成本。
-
公开(公告)号:CN112950564B
公开(公告)日:2022-04-01
申请号:CN202110206853.0
申请日:2021-02-23
Applicant: 北京三快在线科技有限公司
Abstract: 本说明书公开了一种图像检测方法、装置、存储介质及电子设备,对目标图像进行分割,从分割得到的每个单元图像中提取信息分布特征,根据各单元图像的信息分布特征之间的差异为每个单元图像确定出差异权重,并根据各单元图像的差异权重确定目标图像的检测结果。从而能够根据目标图像的各区域信息分布的差异,判断目标图像是否被进行过篡改。
-
公开(公告)号:CN112949642B
公开(公告)日:2022-04-01
申请号:CN202110202832.1
申请日:2021-02-23
Applicant: 北京三快在线科技有限公司
IPC: G06V30/148 , G06V10/34 , G06K9/62 , G06V10/774 , G06V10/764 , G06V10/80
Abstract: 本说明书公开了一种文字生成方法、装置、存储介质及电子设备,本说明书实施例将原始文字图像与指定文字图像输入预先训练的文字生成模型中,通过第一模型对原始文字图像中的文字区域进行预测,并根据预测的文字区域,对原始文字图像进行过滤,得到原始文字图像中文字的结构特征。然后,通过第二模型提取指定文字图像中文字的效果特征。最终,通过第三模型将结构特征与效果特征进行融合,生成目标文字图像。在此过程中,将原始文字图像中文字区域内的文字结构特征筛选出来,可以避免原始文字图像中其他特征对目标文字图像生成的影响,从而提高了目标文字图像的图像质量。
-
-
-
-
-
-
-
-
-