一种基于注意力机制卷积神经网络的自然场景文字检测方法

    公开(公告)号:CN109165697A

    公开(公告)日:2019-01-08

    申请号:CN201811187360.1

    申请日:2018-10-12

    Applicant: 福州大学

    Inventor: 柯逍 罗洁

    Abstract: 本发明涉及一种基于注意力机制卷积神经网络的自然场景文字检测方法,首先对自然场景下的带文本的图像数据进行标注,并将其分为训练集和测试集;然后使用数据增强的方法对文本图像进行处理作为训练数据;基于注意力机制模块和Inception网络构建了基于注意力机制特征提取网络,并采用多尺度特征融合的方法学习不同大小字体的特征;使用课程学习的策略预训练网络;利用自然场景的文本图像数据再次训练网络;使用融合后的特征进行回归得到图像中文本的坐标,得到文本检测的结果。最后在测试集以及其他公开数据集验证训练后的神经网络的有效性。本发明能够解决当前技术面对复杂自然环境下文字召回率不高、识别正确率较低的问题,并在运行速度上具有优势。

    一种基于注意力机制卷积神经网络的自然场景文字检测方法

    公开(公告)号:CN109165697B

    公开(公告)日:2021-11-30

    申请号:CN201811187360.1

    申请日:2018-10-12

    Applicant: 福州大学

    Inventor: 柯逍 罗洁

    Abstract: 本发明涉及一种基于注意力机制卷积神经网络的自然场景文字检测方法,首先对自然场景下的带文本的图像数据进行标注,并将其分为训练集和测试集;然后使用数据增强的方法对文本图像进行处理作为训练数据;基于注意力机制模块和Inception网络构建了基于注意力机制特征提取网络,并采用多尺度特征融合的方法学习不同大小字体的特征;使用课程学习的策略预训练网络;利用自然场景的文本图像数据再次训练网络;使用融合后的特征进行回归得到图像中文本的坐标,得到文本检测的结果。最后在测试集以及其他公开数据集验证训练后的神经网络的有效性。本发明能够解决当前技术面对复杂自然环境下文字召回率不高、识别正确率较低的问题,并在运行速度上具有优势。

Patent Agency Ranking