一种识别图像中的字符串的方法和装置

    公开(公告)号:CN106599900B

    公开(公告)日:2020-04-21

    申请号:CN201510682699.9

    申请日:2015-10-20

    Abstract: 本发明公开了一种识别图像中的字符串的方法和装置,属于计算机技术领域。所述方法包括:根据训练样本库中存储的包含有字符串的样本图像块的图像数据,并基于卷积神经网络算法,构建样本图像块的字符串识别结果对应的概率集合的表达式,概率集合的表达式由待定参数构成;基于使根据概率集合确定出的字符串识别结果为预先存储的样本图像块包含的字符串的概率最大的原则,对待定参数进行训练,得到待定参数的训练值;当获取到待识别的目标图像块时,基于卷积神经网络算法和待定参数的训练值,确定目标图像块的字符串识别结果对应的目标概率集合,根据目标概率集合,确定目标图像块的字符串识别结果。采用本发明,可以提高识别的正确率。

    一种任意形状的场景文本端到端识别方法

    公开(公告)号:CN108549893B

    公开(公告)日:2020-03-31

    申请号:CN201810294058.X

    申请日:2018-04-04

    Abstract: 本发明公开了一种任意形状的场景文本端到端识别方法,通过特征金字塔网络提取文本特征,用于区域提取网络生成候选文本框;然后通过快速区域分类回归分支调整候选文本框位置得到更准确的文本包围盒位置信息;其次将包围盒位置信息输入分割分支,通过像素投票算法得到预测字符序列;最后通过加权编辑距离算法对预测的字符序列进行处理,找到给定词典中预测序列的最匹配单词得到最终的文本识别结果。该方法可以同时检测和识别自然图像中任意形状的场景文本,包括水平文本、多方向文本和曲形文本,并且可以完全地进行端到端训练。本发明提出的检测识别方法相对于现有技术在准确度和通用性这些方面都取得了卓越的效果,有很强的实际应用价值。

    一种识别图像中的字符串的方法和装置

    公开(公告)号:CN106599900A

    公开(公告)日:2017-04-26

    申请号:CN201510682699.9

    申请日:2015-10-20

    Abstract: 本发明公开了一种识别图像中的字符串的方法和装置,属于计算机技术领域。所述方法包括:根据训练样本库中存储的包含有字符串的样本图像块的图像数据,并基于卷积神经网络算法,构建样本图像块的字符串识别结果对应的概率集合的表达式,概率集合的表达式由待定参数构成;基于使根据概率集合确定出的字符串识别结果为预先存储的样本图像块包含的字符串的概率最大的原则,对待定参数进行训练,得到待定参数的训练值;当获取到待识别的目标图像块时,基于卷积神经网络算法和待定参数的训练值,确定目标图像块的字符串识别结果对应的目标概率集合,根据目标概率集合,确定目标图像块的字符串识别结果。采用本发明,可以提高识别的正确率。

    一种任意形状的场景文本端到端识别方法

    公开(公告)号:CN108549893A

    公开(公告)日:2018-09-18

    申请号:CN201810294058.X

    申请日:2018-04-04

    Abstract: 本发明公开了一种任意形状的场景文本端到端识别方法,通过特征金字塔网络提取文本特征,用于区域提取网络生成候选文本框;然后通过快速区域分类回归分支调整候选文本框位置得到更准确的文本包围盒位置信息;其次将包围盒位置信息输入分割分支,通过像素投票算法得到预测字符序列;最后通过加权编辑距离算法对预测的字符序列进行处理,找到给定词典中预测序列的最匹配单词得到最终的文本识别结果。该方法可以同时检测和识别自然图像中任意形状的场景文本,包括水平文本、多方向文本和曲形文本,并且可以完全地进行端到端训练。本发明提出的检测识别方法相对于现有技术在准确度和通用性这些方面都取得了卓越的效果,有很强的实际应用价值。

Patent Agency Ranking