一种训练样本的生成方法及生成装置

    公开(公告)号:CN113011424A

    公开(公告)日:2021-06-22

    申请号:CN202110230635.0

    申请日:2021-03-02

    Abstract: 本说明书公开了一种训练样本的生成方法及生成装置,获取待标注图像以及待标注图像对应的文本标注信息,并将待标注图像输入到预设的识别模型中,得到针对待标注图像中包含的文本行的整体识别结果,作为第一识别结果,以及针对待标注图像中包含的至少部分单个文字的单字识别结果,作为第二识别结果。而后,根据第一识别结果以及第二识别结果,确定针对待标注图像除文本标注信息外的其他标注信息,作为补充标注信息,根据补充标注信息,对文本标注信息进行补充,得到补充后标注信息,并通过补充后标注信息生成待标注图像对应的训练样本,以通过训练样本对识别模型进行训练,从而有效率地产生训练样本。

    一种文字生成方法、装置、存储介质及电子设备

    公开(公告)号:CN112949642A

    公开(公告)日:2021-06-11

    申请号:CN202110202832.1

    申请日:2021-02-23

    Inventor: 周高景 刘曦 张睿

    Abstract: 本说明书公开了一种文字生成方法、装置、存储介质及电子设备,本说明书实施例将原始文字图像与指定文字图像输入预先训练的文字生成模型中,通过第一模型对原始文字图像中的文字区域进行预测,并根据预测的文字区域,对原始文字图像进行过滤,得到原始文字图像中文字的结构特征。然后,通过第二模型提取指定文字图像中文字的效果特征。最终,通过第三模型将结构特征与效果特征进行融合,生成目标文字图像。在此过程中,将原始文字图像中文字区域内的文字结构特征筛选出来,可以避免原始文字图像中其他特征对目标文字图像生成的影响,从而提高了目标文字图像的图像质量。

    文字检测方法、装置、电子设备及存储介质

    公开(公告)号:CN110443258B

    公开(公告)日:2021-03-02

    申请号:CN201910609915.5

    申请日:2019-07-08

    Inventor: 刘曦 张睿

    Abstract: 本申请实施例公开了一种文字检测方法、装置、电子设备及存储介质,所述方法包括:通过卷积神经网络对待检测图像提取多层级特征;对所述多层级特征进行回归,确定所述多层级特征中的初始文字框特征;根据所述多层级特征生成金字塔特征;根据所述初始文字框特征和所述金字塔特征,构建新的文字框特征;根据所述初始文字框特征,对所述新的文字框特征进行二次回归,得到文本框特征;合并所述文本框特征,得到所述待检测图像中的文字检测结果。本申请实施例在对多层级特征进行回归得到初始文字框特征的基础上,对新的文字框特征进行二次回归,提高了文本框边界的拟合准确性,从而提高文字检测结果的准确性。

    一种文字识别方法、装置、电子设备及存储介质

    公开(公告)号:CN111428593A

    公开(公告)日:2020-07-17

    申请号:CN202010172679.8

    申请日:2020-03-12

    Abstract: 本申请公开了一种文字识别方法、装置、电子设备及存储介质,该方法包括:对目标图像进行纹理特征编码,生成第一特征序列;对第一特征序列进行解码,得到第一识别结果;基于递归神经网络对第一特征序列进行上下文互信息编码,生成第二特征序列;对第二特征序列进行解码,得到第二识别结果;根据第一识别结果和第二识别结果联合确定文字识别结果。本申请的有益效果在于,将文字本身特征与上下文互信息相结合,显著提高文字识别的准确率,且计算量小、计算速度快、可用性强。

Patent Agency Ranking