-
公开(公告)号:CN112163596A
公开(公告)日:2021-01-01
申请号:CN202010919026.1
申请日:2020-09-04
Applicant: 华南理工大学 , 华南理工大学珠海现代产业创新研究院
Abstract: 本发明公开了一种复杂场景文本识别方法、系统、计算机设备及存储介质,该方法包括:将残差卷积神经网络作为文本图像编码器,对文本图像进行特征提取,得到特征图;构建连接时序分类解码器和二维注意力解码器;并联连接时序分类解码器和二维注意力解码器,使两者共享文本图像编码器的输出;将特征图输入连接时序分类解码器,转换成一维特征序列,并将一维特征序列译码成第一文本序列;将特征图输入二维注意力解码器,转换成二维特征序列,并将二维特征序列译码成第二文本序列;利用输出选择策略对第一文本序列和第二文本序列进行优选,输出文本识别结果。本发明实现了对长短不一,线性文本序列和二维文本序列混合的复杂多样场景文本的精准识别。
-
公开(公告)号:CN112163596B
公开(公告)日:2024-01-05
申请号:CN202010919026.1
申请日:2020-09-04
Applicant: 华南理工大学 , 华南理工大学珠海现代产业创新研究院
IPC: G06V20/62 , G06V30/19 , G06V10/764 , G06V10/82 , G06N3/0455 , G06N3/0464 , G06N3/08
Abstract: 本发明公开了一种复杂场景文本识别方法、系统、计算机设备及存储介质,该方法包括:将残差卷积神经网络作为文本图像编码器,对文本图像进行特征提取,得到特征图;构建连接时序分类解码器和二维注意力解码器;并联连接时序分类解码器和二维注意力解码器,使两者共享文本图像编码器的输出;将特征图输入连接时序分类解码器,转换成一维特征序列,并将一维特征序列译码成第一文本序列;将特征图输入二维注意力解码器,转换成二维特征序列,并将二维特征序列译码成第二文本序列;利用输出选择策略对第一文本序列和第二文本序列进行优选,输出文本识别结果。本发明实现了对长短不一,线性文
-
公开(公告)号:CN114782961A
公开(公告)日:2022-07-22
申请号:CN202210285238.8
申请日:2022-03-23
Applicant: 华南理工大学 , 人工智能与数字经济广东省实验室(广州)
Abstract: 本发明公开了一种基于形状变换的字符图像增广方法,包括以下步骤:构建形状变换生成对抗网络,包括生成器和判别器;以原始字符图像作为生成器的输入,经过空间变换之后产生形变的字符图像,将生成器的输出端与判别器的输入端连接,同时,将目标字符图像输入到判别器的另一个输入端,判别器输出对形变的字符图像和目标字符图像的判别结果;训练所述的形状变换生成对抗网络;使用训练好的生成器生成增广后的字符图像。本发明方法结合仿射矩阵和TPS变换采样网格参数使STN能够同时产生全局和局部的形状变化,能够更好的拟合字符的形状特征,使产生的字符真实性和多样性更好,使用增广后的数据所训练的分类器的分类性能进一步提升。
-
公开(公告)号:CN114782961B
公开(公告)日:2023-04-18
申请号:CN202210285238.8
申请日:2022-03-23
Applicant: 华南理工大学 , 人工智能与数字经济广东省实验室(广州)
IPC: G06V30/19 , G06T3/00 , G06N3/0464 , G06N3/048 , G06N3/094
Abstract: 本发明公开了一种基于形状变换的字符图像增广方法,包括以下步骤:构建形状变换生成对抗网络,包括生成器和判别器;以原始字符图像作为生成器的输入,经过空间变换之后产生形变的字符图像,将生成器的输出端与判别器的输入端连接,同时,将目标字符图像输入到判别器的另一个输入端,判别器输出对形变的字符图像和目标字符图像的判别结果;训练所述的形状变换生成对抗网络;使用训练好的生成器生成增广后的字符图像。本发明方法结合仿射矩阵和TPS变换采样网格参数使STN能够同时产生全局和局部的形状变化,能够更好的拟合字符的形状特征,使产生的字符真实性和多样性更好,使用增广后的数据所训练的分类器的分类性能进一步提升。
-
公开(公告)号:CN114494003B
公开(公告)日:2022-06-21
申请号:CN202210336338.9
申请日:2022-04-01
Applicant: 华南理工大学 , 人工智能与数字经济广东省实验室(广州)
Abstract: 本发明公开了一种联合形状变换和纹理转换的古文字生成方法,包括:构建形状变换生成对抗网络A,包括生成器A1和判别器A2;构建纹理转换生成对抗网络B,包括生成器B1、判别器B2、生成器B3和判别器B4,纹理转换生成对抗网络B为循环生成对抗网络;将形状变换生成对抗网络A和纹理转换生成对抗网络B进行连接,获得摄影古文字生成网络模型;联合训练摄影古文字生成网络模型中的形状变换生成对抗网络A和纹理转换生成对抗网络B;使用训练好的生成器A1和生成器B1,将生成器A1的输出端与生成器B1输入端相连,获得摄影古文字图像生成器;采用所述的摄影古文字图像生成器进行古文字生成。
-
公开(公告)号:CN114494003A
公开(公告)日:2022-05-13
申请号:CN202210336338.9
申请日:2022-04-01
Applicant: 华南理工大学 , 人工智能与数字经济广东省实验室(广州)
Abstract: 本发明公开了一种联合形状变换和纹理转换的古文字生成方法,包括:构建形状变换生成对抗网络A,包括生成器A1和判别器A2;构建纹理转换生成对抗网络B,包括生成器B1、判别器B2、生成器B3和判别器B4,纹理转换生成对抗网络B为循环生成对抗网络;将形状变换生成对抗网络A和纹理转换生成对抗网络B进行连接,获得摄影古文字生成网络模型;联合训练摄影古文字生成网络模型中的形状变换生成对抗网络A和纹理转换生成对抗网络B;使用训练好的生成器A1和生成器B1,将生成器A1的输出端与生成器B1输入端相连,获得摄影古文字图像生成器;采用所述的摄影古文字图像生成器进行古文字生成。
-
-
-
-
-