基于神经网络和注意力机制结合的文字识别系统及方法

    公开(公告)号:CN109389091A

    公开(公告)日:2019-02-26

    申请号:CN201811230112.0

    申请日:2018-10-22

    Abstract: 本发明请求保护一种基于神经网络和注意力机制结合的文字识别系统及方法,具体包括:卷积神经网络特征提取模块,用于文字图像的空间特征;将卷积神经网络提取的空间特征输入到双向长短期记忆网络模块,双向长短期记忆网络能够提取文字的序列特征;将提取的特征向量进行语义编码,然后通过注意力机制分配特征向量的注意力权值,让注意力集中在权值较高的特征向量;模型的解码部分,通过嵌套长短期记忆网络实现,将注意力提取到的特征和前一时刻的预测信息作为嵌套长短期记忆网络的输入,前后均采用长短期记忆网络的目的是为了保持特征向量的时间特性,使模型注意位置点随着时间不断变化;本发明能够更准确的检测自然场景中的文字区域,并且对小目标文字和倾斜角度小的文本有很好的检测效果。

    基于神经网络和注意力机制结合的文字识别系统及方法

    公开(公告)号:CN109389091B

    公开(公告)日:2022-05-03

    申请号:CN201811230112.0

    申请日:2018-10-22

    Abstract: 本发明请求保护一种基于神经网络和注意力机制结合的文字识别系统及方法,具体包括:卷积神经网络特征提取模块,用于文字图像的空间特征;将卷积神经网络提取的空间特征输入到双向长短期记忆网络模块,双向长短期记忆网络能够提取文字的序列特征;将提取的特征向量进行语义编码,然后通过注意力机制分配特征向量的注意力权值,让注意力集中在权值较高的特征向量;模型的解码部分,通过嵌套长短期记忆网络实现,将注意力提取到的特征和前一时刻的预测信息作为嵌套长短期记忆网络的输入,前后均采用长短期记忆网络的目的是为了保持特征向量的时间特性,使模型注意位置点随着时间不断变化;本发明能够更准确的检测自然场景中的文字区域,并且对小目标文字和倾斜角度小的文本有很好的检测效果。

    一种基于深度学习的地标建筑物识别与检测方法

    公开(公告)号:CN110046572A

    公开(公告)日:2019-07-23

    申请号:CN201910299200.4

    申请日:2019-04-15

    Abstract: 本发明请求保护一种基于深度学习的地标建筑物识别与检测方法,包括步骤:对需要识别的地标建筑物图像,输入DenseNet网络得到含有目标建筑物特征信息的特征框图,然后送入区域建议网络预测该特征框图的二元类别及目标建筑物在原图像中的坐标;接着使用RoI Align方法,将预测候选框完整地映射到特征框图上;最后这些更加精准的特征框图会进行分类和边框回归,得到不同地标建筑物的预测概率以及所在的坐标位置,通过非极大值抑制的方法将多余的候选框去除,把区域覆盖较广的图融合起来,最终实现了地标建筑物的识别与检测。本发明对地标建筑物候选框的预测更为精准,范围更大,并且对复杂环境下的地标建筑物图像也有较好的识别能力。

    一种基于深度学习的医用胶片上文字信息的识别方法

    公开(公告)号:CN113392844A

    公开(公告)日:2021-09-14

    申请号:CN202110661076.9

    申请日:2021-06-15

    Abstract: 本发明涉及一种基于深度学习的医用胶片上文字信息的识别方法,属于医学影像处理技术领域。该方法包括:S1:将待识别文字信息的胶片图像输入到特征提取网络,获取含有文字多尺度的特征图;S2:将步骤S1获取的特征图输入到多方向窗口提取网络中,得到建议框;S3:利用改进的建议框旋转模块处理步骤S2的建议框,得到文本检测结果;S4:将步骤S3的文本检测结果输入到编解码文字识别模块中,得到胶片上对应的文字识别结果。本发明实现了医用胶片上文字信息自动识别,直接输出医用胶片上对应的中英文文字信息,无需人为修正和验证,效率高,准确率也有保障。

Patent Agency Ranking