复杂场景文本识别方法、系统、计算机设备及存储介质

    公开(公告)号:CN112163596A

    公开(公告)日:2021-01-01

    申请号:CN202010919026.1

    申请日:2020-09-04

    Abstract: 本发明公开了一种复杂场景文本识别方法、系统、计算机设备及存储介质,该方法包括:将残差卷积神经网络作为文本图像编码器,对文本图像进行特征提取,得到特征图;构建连接时序分类解码器和二维注意力解码器;并联连接时序分类解码器和二维注意力解码器,使两者共享文本图像编码器的输出;将特征图输入连接时序分类解码器,转换成一维特征序列,并将一维特征序列译码成第一文本序列;将特征图输入二维注意力解码器,转换成二维特征序列,并将二维特征序列译码成第二文本序列;利用输出选择策略对第一文本序列和第二文本序列进行优选,输出文本识别结果。本发明实现了对长短不一,线性文本序列和二维文本序列混合的复杂多样场景文本的精准识别。

    一种基于形状变换的字符图像增广方法

    公开(公告)号:CN114782961A

    公开(公告)日:2022-07-22

    申请号:CN202210285238.8

    申请日:2022-03-23

    Abstract: 本发明公开了一种基于形状变换的字符图像增广方法,包括以下步骤:构建形状变换生成对抗网络,包括生成器和判别器;以原始字符图像作为生成器的输入,经过空间变换之后产生形变的字符图像,将生成器的输出端与判别器的输入端连接,同时,将目标字符图像输入到判别器的另一个输入端,判别器输出对形变的字符图像和目标字符图像的判别结果;训练所述的形状变换生成对抗网络;使用训练好的生成器生成增广后的字符图像。本发明方法结合仿射矩阵和TPS变换采样网格参数使STN能够同时产生全局和局部的形状变化,能够更好的拟合字符的形状特征,使产生的字符真实性和多样性更好,使用增广后的数据所训练的分类器的分类性能进一步提升。

    一种基于形状变换的字符图像增广方法

    公开(公告)号:CN114782961B

    公开(公告)日:2023-04-18

    申请号:CN202210285238.8

    申请日:2022-03-23

    Abstract: 本发明公开了一种基于形状变换的字符图像增广方法,包括以下步骤:构建形状变换生成对抗网络,包括生成器和判别器;以原始字符图像作为生成器的输入,经过空间变换之后产生形变的字符图像,将生成器的输出端与判别器的输入端连接,同时,将目标字符图像输入到判别器的另一个输入端,判别器输出对形变的字符图像和目标字符图像的判别结果;训练所述的形状变换生成对抗网络;使用训练好的生成器生成增广后的字符图像。本发明方法结合仿射矩阵和TPS变换采样网格参数使STN能够同时产生全局和局部的形状变化,能够更好的拟合字符的形状特征,使产生的字符真实性和多样性更好,使用增广后的数据所训练的分类器的分类性能进一步提升。

    一种联合形状变换和纹理转换的古文字生成方法

    公开(公告)号:CN114494003B

    公开(公告)日:2022-06-21

    申请号:CN202210336338.9

    申请日:2022-04-01

    Abstract: 本发明公开了一种联合形状变换和纹理转换的古文字生成方法,包括:构建形状变换生成对抗网络A,包括生成器A1和判别器A2;构建纹理转换生成对抗网络B,包括生成器B1、判别器B2、生成器B3和判别器B4,纹理转换生成对抗网络B为循环生成对抗网络;将形状变换生成对抗网络A和纹理转换生成对抗网络B进行连接,获得摄影古文字生成网络模型;联合训练摄影古文字生成网络模型中的形状变换生成对抗网络A和纹理转换生成对抗网络B;使用训练好的生成器A1和生成器B1,将生成器A1的输出端与生成器B1输入端相连,获得摄影古文字图像生成器;采用所述的摄影古文字图像生成器进行古文字生成。

    一种联合形状变换和纹理转换的古文字生成方法

    公开(公告)号:CN114494003A

    公开(公告)日:2022-05-13

    申请号:CN202210336338.9

    申请日:2022-04-01

    Abstract: 本发明公开了一种联合形状变换和纹理转换的古文字生成方法,包括:构建形状变换生成对抗网络A,包括生成器A1和判别器A2;构建纹理转换生成对抗网络B,包括生成器B1、判别器B2、生成器B3和判别器B4,纹理转换生成对抗网络B为循环生成对抗网络;将形状变换生成对抗网络A和纹理转换生成对抗网络B进行连接,获得摄影古文字生成网络模型;联合训练摄影古文字生成网络模型中的形状变换生成对抗网络A和纹理转换生成对抗网络B;使用训练好的生成器A1和生成器B1,将生成器A1的输出端与生成器B1输入端相连,获得摄影古文字图像生成器;采用所述的摄影古文字图像生成器进行古文字生成。

Patent Agency Ranking