文字识别方法、装置、电子设备及存储介质

    公开(公告)号:CN112329766B

    公开(公告)日:2024-10-15

    申请号:CN202011098938.3

    申请日:2020-10-14

    Abstract: 本申请实施例公开了一种文字识别方法、装置、电子设备及存储介质,该方法包括:通过标准卷积提取待识别图像的图像特征并扩展通道数,生成第一特征图;通过包括逐点组卷积和深度卷积的模块化结构对所述第一特征图进行特征提取处理,得到处理后特征图;对所述处理后特征图进行池化处理,得到池化特征图;将所述池化特征图作为所述模块化结构的输入,循环执行上述的模块化结构处理和池化处理,直至得到的池化特征图满足预设条件;对所述池化特征图进行标准卷积处理,得到编码结果;对所述编码结果进行解码,得到识别结果。本申请实施例在保证识别精度的前提下,降低了计算复杂度,提高了识别速度,而且降低了计算资源的消耗。

    一种模型训练及图像处理方法、装置

    公开(公告)号:CN113688832B

    公开(公告)日:2023-02-03

    申请号:CN202110993903.4

    申请日:2021-08-27

    Abstract: 本说明书公开了一种模型训练及图像处理方法、装置。通过待训练的图像处理模型的第一模型中的对待处理图像进行处理并输出已处理图像,并且采用图像处理模型中的第二模型来预测已处理图像中各已处理区域与对应的标注图像的标注区之间的预测差异度,以根据预测差异度来为各已处理区域确定出区域权重,并通过以区域权重加权后的已处理图像和标注图像之间真实的标注差异度的最小为目标调整图像处理模型中的参数。使得在训练的过程中能够对预测差异度较大的区域投入更多的关注,从而避免待处理图像中需要进行处理的区域较小而导致模型训练得到较小的损失时所输出的已处理图像在需要处理的区域仍然难以得到较好的处理。

    UI图片测试方法、装置、电子设备
    43.
    发明公开

    公开(公告)号:CN114387460A

    公开(公告)日:2022-04-22

    申请号:CN202111524663.X

    申请日:2021-12-14

    Abstract: 本申请公开了一种UI图片测试方法,属于计算机技术领域,有助于提升UI图片测试的准确度和测试效率。所述方法包括:基于模版匹配方法,获取待测试UI图片的基准图与运行图的第一相似度;将第一相似度与预设第一阈值范围进行比较,确定模版匹配结果,其中,模版匹配结果用于指示基准图与运行图一致或不一致,或者,无法确定基准图与运行图是否一致:响应于模版匹配结果指示无法确定基准图与运行图是否一致,通过预设的神经网络模型对基准图和运行图进行特征匹配,确定基准图与运行图的第二相似度;根据第二相似度确定运行图与基准图是否一致。本方法通过融合模板匹配和神经网络网络匹配,提升了UI图片测试的准确度和测试效率。

    一种识别模型的训练方法及装置
    44.
    发明公开

    公开(公告)号:CN114332873A

    公开(公告)日:2022-04-12

    申请号:CN202111579413.6

    申请日:2021-12-22

    Abstract: 本说明书公开了一种识别模型的训练方法及装置,通过从各文字识别的场景中,确定目标场景和其他场景,并将所述目标场景对应的各图像,作为各第一训练样本,针对每个其他场景,确定该其他场景对应的训练完成的识别模型,作为候选识别模型,针对每个第一训练样本,将该第一训练样本作为输入,输入至少一个候选识别模型,确定该第一训练样本的标注,将各第一训练样本输入待训练的目标识别模型中,得到目标识别模型输出的各目标识别结果,并基于各第一训练样本的标注和目标识别结果,对目标场景对应的目标识别模型进行训练。不需要人工对样本进行标注,减少了训练样本的生成时间与成本,提高了目标识别模型的训练效率。

    识别证照图像完整性的方法、装置、设备及存储介质

    公开(公告)号:CN113947775A

    公开(公告)日:2022-01-18

    申请号:CN202111165131.1

    申请日:2021-09-30

    Abstract: 本申请公开了识别证照图像完整性的方法、装置、设备及存储介质,属于图像处理技术领域。所述方法包括:获取图像识别模型及待识别的证照图像,图像识别模型包括目标分类器网络子模型与目标主干网络子模型,目标分类器网络子模型与目标主干网络子模型基于样本图像训练得到;将证照图像输入至目标主干网络子模型,通过目标主干网络子模型输出证照图像的图像特征;将图像特征输入至目标分类器网络子模型,通过目标分类器网络子模型输出证照图像的分类结果;基于证照图像的分类结果得到证照图像的完整性识别结果。本申请使用子模型的完成的任务要求低,易于实现,降低成本,可以直接根据证照图像的分类结果得到完整性识别结果,准确率与通用性较高。

    一种模型训练以及图像修复方法及装置

    公开(公告)号:CN113888415A

    公开(公告)日:2022-01-04

    申请号:CN202111045365.2

    申请日:2021-09-07

    Abstract: 本说明书公开了一种模型训练以及图像修复方法及装置,通过将各损坏图像及其掩膜,作为各训练样本对输入图像修复模型的处理层,对各损坏图像的损坏部分进行动态采样,确定各初始修复结果,并将由各初始修复结果位于损坏部分的子图像填充入损坏图像得到的各中间修复结果作为输入,输入到该图像修复模型的纹理处理层,提取纹理特征,进而根据该纹理特征和初始修复结果确定最终修复结果,基于各训练样本对的标注和最终修复结果对图像修复模型进行训练。本方法中采用动态采样确定训练样本对的初始修复结果,考虑到了损坏部分与未损坏部分的差距,且通过纹理特征的学习,使得训练好的图像修复模型输出的修复结果与原始图像接近,保证了图像修复效果。

    一种训练样本的生成方法及生成装置

    公开(公告)号:CN113011424A

    公开(公告)日:2021-06-22

    申请号:CN202110230635.0

    申请日:2021-03-02

    Abstract: 本说明书公开了一种训练样本的生成方法及生成装置,获取待标注图像以及待标注图像对应的文本标注信息,并将待标注图像输入到预设的识别模型中,得到针对待标注图像中包含的文本行的整体识别结果,作为第一识别结果,以及针对待标注图像中包含的至少部分单个文字的单字识别结果,作为第二识别结果。而后,根据第一识别结果以及第二识别结果,确定针对待标注图像除文本标注信息外的其他标注信息,作为补充标注信息,根据补充标注信息,对文本标注信息进行补充,得到补充后标注信息,并通过补充后标注信息生成待标注图像对应的训练样本,以通过训练样本对识别模型进行训练,从而有效率地产生训练样本。

    一种文字生成方法、装置、存储介质及电子设备

    公开(公告)号:CN112949642A

    公开(公告)日:2021-06-11

    申请号:CN202110202832.1

    申请日:2021-02-23

    Inventor: 周高景 刘曦 张睿

    Abstract: 本说明书公开了一种文字生成方法、装置、存储介质及电子设备,本说明书实施例将原始文字图像与指定文字图像输入预先训练的文字生成模型中,通过第一模型对原始文字图像中的文字区域进行预测,并根据预测的文字区域,对原始文字图像进行过滤,得到原始文字图像中文字的结构特征。然后,通过第二模型提取指定文字图像中文字的效果特征。最终,通过第三模型将结构特征与效果特征进行融合,生成目标文字图像。在此过程中,将原始文字图像中文字区域内的文字结构特征筛选出来,可以避免原始文字图像中其他特征对目标文字图像生成的影响,从而提高了目标文字图像的图像质量。

    基于渐进式编码的文字识别方法、装置、电子设备

    公开(公告)号:CN112712079A

    公开(公告)日:2021-04-27

    申请号:CN202110019931.6

    申请日:2021-01-07

    Inventor: 宋祺 姜仟艺 张睿

    Abstract: 本申请公开了一种基于渐进式编码的文字识别方法,属于计算机技术领域,有助于提升图像中文字识别的准确率。所述文字识别方法包括:预先训练包括:级联的至少三个编码模块,以及,与每个所述编码模块对应的一个解码模块的编码‑解码网络模型,并在预测阶段,依次执行所述至少三个编码模块,对目标图像进行渐进深度的特征编码,分别得到每个所述编码模块的编码输出;分别执行每个所述解码模块,对相应所述编码模块的所述编码输出进行解码,得到各所述解码模块对所述目标图像的文字识别结果;对各所述解码模块对所述目标图像的文本识别结果进行融合处理,确定所述编码‑解码网络模型对所述目标图像的文字识别结果,提升了图像中的文字进行识别的准确率。

    文字检测方法、装置、电子设备及存储介质

    公开(公告)号:CN110443258B

    公开(公告)日:2021-03-02

    申请号:CN201910609915.5

    申请日:2019-07-08

    Inventor: 刘曦 张睿

    Abstract: 本申请实施例公开了一种文字检测方法、装置、电子设备及存储介质,所述方法包括:通过卷积神经网络对待检测图像提取多层级特征;对所述多层级特征进行回归,确定所述多层级特征中的初始文字框特征;根据所述多层级特征生成金字塔特征;根据所述初始文字框特征和所述金字塔特征,构建新的文字框特征;根据所述初始文字框特征,对所述新的文字框特征进行二次回归,得到文本框特征;合并所述文本框特征,得到所述待检测图像中的文字检测结果。本申请实施例在对多层级特征进行回归得到初始文字框特征的基础上,对新的文字框特征进行二次回归,提高了文本框边界的拟合准确性,从而提高文字检测结果的准确性。

Patent Agency Ranking