-
公开(公告)号:CN106570456A
公开(公告)日:2017-04-19
申请号:CN201610895498.1
申请日:2016-10-13
Applicant: 华南理工大学
CPC classification number: G06K9/00409 , G06K9/00402 , G06K9/6256 , G06K9/6885 , G06N3/084
Abstract: 本发明公开了基于全卷积递归网络的手写汉字文本识别方法,包括步骤路径积分层将联机的笔迹信息转化为相应的脱机特征图片;全卷积网络提取脱机特征图片的高维抽象表达,生成相应的响应图;多层双向递归网络将所述响应图的每一帧完成识别并输出一个关于字符集的概率分布;转录层使用前向计算和反向梯度传播的动态规划算法,使得整个手写汉字文本识别模型可以直接基于文本数据进行训练;和语言模型后处理。本发明对于原联机笔迹信息具有不同程度的刻画能力;在没有对手写汉字文本预分割的情况下,可以接受任意长度的输入序列,并输出一个对应的输出序列;整体性能强;采用集束搜索方法嵌入语言模型解码全卷积递归网络,进一步提高了识别率。
-
公开(公告)号:CN106650725B
公开(公告)日:2020-06-26
申请号:CN201611070587.9
申请日:2016-11-29
Applicant: 华南理工大学
Abstract: 本发明公开了基于全卷积神经网络的候选文本框生成和文本检测方法,包括步骤:生成文本区域候选框,inception‑RPN以自然场景图片和一套标记文本区域的真实边界框作为输入,产生可控数量的单词区域候选框,在VGG16模型的卷积特征响应图上滑动一个inception网络,并在每个滑动位置辅助一套文本特征先验框;并入容易引起歧义的文本类别监督信息,融入多层次的区域下采样信息,进行文本检测;通过反向传播和随机梯度下降,以一种端到端的方式训练inception候选框生成网络和文本检测网络;候选框迭代投票以一种补充的方式获得更高的文本召回率,使用候选框过滤算法,移除过剩的检测框。本发明在ICDAR 2011和2013robust文本检测标准数据库上分别获得0.83和0.85的准确率,优于先前最好的结果。
-
公开(公告)号:CN106570456B
公开(公告)日:2019-08-09
申请号:CN201610895498.1
申请日:2016-10-13
Applicant: 华南理工大学
Abstract: 本发明公开了基于全卷积递归网络的手写汉字文本识别方法,包括步骤路径积分层将联机的笔迹信息转化为相应的脱机特征图片;全卷积网络提取脱机特征图片的高维抽象表达,生成相应的响应图;多层双向递归网络将所述响应图的每一帧完成识别并输出一个关于字符集的概率分布;转录层使用前向计算和反向梯度传播的动态规划算法,使得整个手写汉字文本识别模型可以直接基于文本数据进行训练;和语言模型后处理。本发明对于原联机笔迹信息具有不同程度的刻画能力;在没有对手写汉字文本预分割的情况下,可以接受任意长度的输入序列,并输出一个对应的输出序列;整体性能强;采用集束搜索方法嵌入语言模型解码全卷积递归网络,进一步提高了识别率。
-
公开(公告)号:CN106650725A
公开(公告)日:2017-05-10
申请号:CN201611070587.9
申请日:2016-11-29
Applicant: 华南理工大学
CPC classification number: G06K9/325 , G06N3/0454 , G06N3/084
Abstract: 本发明公开了基于全卷积神经网络的候选文本框生成和文本检测方法,包括步骤:生成文本区域候选框,inception‑RPN以自然场景图片和一套标记文本区域的真实边界框作为输入,产生可控数量的单词区域候选框,在VGG16模型的卷积特征响应图上滑动一个inception网络,并在每个滑动位置辅助一套文本特征先验框;并入容易引起歧义的文本类别监督信息,融入多层次的区域下采样信息,进行文本检测;通过反向传播和随机梯度下降,以一种端到端的方式训练inception候选框生成网络和文本检测网络;候选框迭代投票以一种补充的方式获得更高的文本召回率,使用候选框过滤算法,移除过剩的检测框。本发明在ICDAR 2011和2013robust文本检测标准数据库上分别获得0.83和0.85的准确率,优于先前最好的结果。
-
-
-