-
公开(公告)号:CN109948533B
公开(公告)日:2021-02-09
申请号:CN201910208074.7
申请日:2019-03-19
Applicant: 讯飞智元信息科技有限公司
IPC: G06K9/00
Abstract: 本申请提供了一种文本检测方法、装置、设备及可读存储介质,方法包括:从待检测文本中获取文本框相关信息,文本框的相关信息至少包括四个顶点集,一顶点集对应一顶点类别;以三个有序顶点为一组生成候选文本框,获得候选文本框集,生成一候选文本框的三个有序顶点取自四个顶点集中的三个不同顶点集,且该三个有序顶点中的每个顶点在对应的候选文本框中所属的顶点类别与其所属的顶点集对应的顶点类别一致,且该三个有序顶点形成的夹角与预设角度的差值的绝对值小于预设角度阈值;从候选文本框集中确定待检测文本中文本行的目标文本框。本申请提供的文本检测方法具有较高的检测效率和检测准确度,检测效果较好。
-
公开(公告)号:CN111126410B
公开(公告)日:2022-11-18
申请号:CN201911418197.X
申请日:2019-12-31
Applicant: 讯飞智元信息科技有限公司
IPC: G06V30/148 , G06V30/18 , G06V10/82 , G06N3/04 , G06N3/08
Abstract: 本申请实施例公开了一种字符识别方法、装置、设备及可读存储介质,将具有待识别的字符的图像按照字符的排列方向裁剪为若干字符条,利用全卷积网络识别模型获取字符条的特征图,对字符条的特征图进行变形处理,得到字符条的携带上下文信息的特征序列,基于该特征序列预测字符条中的字符。由于卷积运算不依赖于前一步的状态且与输入序列的长度无关,因此可以进行并行计算,大大加快了特征序列的建模过程,而且,相对于循环神经网络,卷积网络参数少,计算复杂度较低,占用的内存空间和运行时间也较少,易于部署。
-
公开(公告)号:CN111126410A
公开(公告)日:2020-05-08
申请号:CN201911418197.X
申请日:2019-12-31
Applicant: 讯飞智元信息科技有限公司
Abstract: 本申请实施例公开了一种字符识别方法、装置、设备及可读存储介质,将具有待识别的字符的图像按照字符的排列方向裁剪为若干字符条,利用全卷积网络识别模型获取字符条的特征图,对字符条的特征图进行变形处理,得到字符条的携带上下文信息的特征序列,基于该特征序列预测字符条中的字符。由于卷积运算不依赖于前一步的状态且与输入序列的长度无关,因此可以进行并行计算,大大加快了特征序列的建模过程,而且,相对于循环神经网络,卷积网络参数少,计算复杂度较低,占用的内存空间和运行时间也较少,易于部署。
-
公开(公告)号:CN109948533A
公开(公告)日:2019-06-28
申请号:CN201910208074.7
申请日:2019-03-19
Applicant: 讯飞智元信息科技有限公司
IPC: G06K9/00
Abstract: 本申请提供了一种文本检测方法、装置、设备及可读存储介质,方法包括:从待检测文本中获取文本框相关信息,文本框的相关信息至少包括四个顶点集,一顶点集对应一顶点类别;以三个有序顶点为一组生成候选文本框,获得候选文本框集,生成一候选文本框的三个有序顶点取自四个顶点集中的三个不同顶点集,且该三个有序顶点中的每个顶点在对应的候选文本框中所属的顶点类别与其所属的顶点集对应的顶点类别一致,且该三个有序顶点形成的夹角与预设角度的差值的绝对值小于预设角度阈值;从候选文本框集中确定待检测文本中文本行的目标文本框。本申请提供的文本检测方法具有较高的检测效率和检测准确度,检测效果较好。
-
-
-