-
公开(公告)号:CN110334705B
公开(公告)日:2021-08-03
申请号:CN201910553486.4
申请日:2019-06-25
Applicant: 华中科技大学
IPC: G06K9/32 , G06K9/62 , G06F40/263 , G06N3/04 , G06N3/08
Abstract: 本发明公开了一种结合全局和局部信息的场景文本图像的语种识别方法。通过提取文字图像的基本特征,随后分别提取全局和局部特征表示;全局提取分支使用全局最大池化将整图表示为一个向量,并做类别得分预测;局部聚合分支对图像的局部块分别做概率预测,然后将这一系列概率分布结合起来得到局部层面的类别预测得分;最后根据上述分支预测情况动态融合全局和局部的预测得分,得到最终识别结果。该方法同时注意到文字图像的整体特征和局部有区分性的特征,并且可以实现一步到位端到端训练。本发明相对于现有利用局部特征的技术,能够准确提取局部的有区分性的特征,在准确度、运行效率和通用性方面都取得了卓越效果,有很强的实际应用价值。
-
公开(公告)号:CN110334705A
公开(公告)日:2019-10-15
申请号:CN201910553486.4
申请日:2019-06-25
Applicant: 华中科技大学
Abstract: 本发明公开了一种结合全局和局部信息的场景文本图像的语种识别方法。通过提取文字图像的基本特征,随后分别提取全局和局部特征表示;全局提取分支使用全局最大池化将整图表示为一个向量,并做类别得分预测;局部聚合分支对图像的局部块分别做概率预测,然后将这一系列概率分布结合起来得到局部层面的类别预测得分;最后根据上述分支预测情况动态融合全局和局部的预测得分,得到最终识别结果。该方法同时注意到文字图像的整体特征和局部有区分性的特征,并且可以实现一步到位端到端训练。本发明相对于现有利用局部特征的技术,能够准确提取局部的有区分性的特征,在准确度、运行效率和通用性方面都取得了卓越效果,有很强的实际应用价值。
-