Patent search ap:("华南理工大学" OR "华南理工大学珠海现代产业创新研究院") AND inv:"黄鸿翔" Page 1

1.

发明公开
复杂场景文本识别方法、系统、计算机设备及存储介质有权

公开(公告)号：CN112163596A

公开(公告)日：2021-01-01

申请号：CN202010919026.1

申请日：2020-09-04

Applicant: 华南理工大学 , 华南理工大学珠海现代产业创新研究院

Inventor： 黄双萍 , 杨代辉 , 黄鸿翔 , 郑锐佳 , 李智龙 , 李南鹏

IPC: G06K9/62 , G06N3/04

Abstract: 本发明公开了一种复杂场景文本识别方法、系统、计算机设备及存储介质，该方法包括：将残差卷积神经网络作为文本图像编码器，对文本图像进行特征提取，得到特征图；构建连接时序分类解码器和二维注意力解码器；并联连接时序分类解码器和二维注意力解码器，使两者共享文本图像编码器的输出；将特征图输入连接时序分类解码器，转换成一维特征序列，并将一维特征序列译码成第一文本序列；将特征图输入二维注意力解码器，转换成二维特征序列，并将二维特征序列译码成第二文本序列；利用输出选择策略对第一文本序列和第二文本序列进行优选，输出文本识别结果。本发明实现了对长短不一，线性文本序列和二维文本序列混合的复杂多样场景文本的精准识别。

2.

发明授权
复杂场景文本识别方法、系统、计算机设备及存储介质有权

公开(公告)号：CN112163596B

公开(公告)日：2024-01-05

申请号：CN202010919026.1

申请日：2020-09-04

Applicant: 华南理工大学 , 华南理工大学珠海现代产业创新研究院

Inventor： 黄双萍 , 杨代辉 , 黄鸿翔 , 郑锐佳 , 李智龙 , 李南鹏

IPC: G06V20/62 , G06V30/19 , G06V10/764 , G06V10/82 , G06N3/0455 , G06N3/0464 , G06N3/08

Abstract: 本发明公开了一种复杂场景文本识别方法、系统、计算机设备及存储介质，该方法包括：将残差卷积神经网络作为文本图像编码器，对文本图像进行特征提取，得到特征图；构建连接时序分类解码器和二维注意力解码器；并联连接时序分类解码器和二维注意力解码器，使两者共享文本图像编码器的输出；将特征图输入连接时序分类解码器，转换成一维特征序列，并将一维特征序列译码成第一文本序列；将特征图输入二维注意力解码器，转换成二维特征序列，并将二维特征序列译码成第二文本序列；利用输出选择策略对第一文本序列和第二文本序列进行优选，输出文本识别结果。本发明实现了对长短不一，线性文

3.

发明公开
一种基于形状变换的字符图像增广方法有权

公开(公告)号：CN114782961A

公开(公告)日：2022-07-22

申请号：CN202210285238.8

申请日：2022-03-23

Applicant: 华南理工大学 , 人工智能与数字经济广东省实验室(广州)

Inventor： 黄双萍 , 黄鸿翔 , 杨代辉

IPC: G06V30/19 , G06T3/00 , G06N3/04 , G06N3/08

Abstract: 本发明公开了一种基于形状变换的字符图像增广方法，包括以下步骤：构建形状变换生成对抗网络，包括生成器和判别器；以原始字符图像作为生成器的输入，经过空间变换之后产生形变的字符图像，将生成器的输出端与判别器的输入端连接，同时，将目标字符图像输入到判别器的另一个输入端，判别器输出对形变的字符图像和目标字符图像的判别结果；训练所述的形状变换生成对抗网络；使用训练好的生成器生成增广后的字符图像。本发明方法结合仿射矩阵和TPS变换采样网格参数使STN能够同时产生全局和局部的形状变化，能够更好的拟合字符的形状特征，使产生的字符真实性和多样性更好，使用增广后的数据所训练的分类器的分类性能进一步提升。

4.

发明授权
一种基于形状变换的字符图像增广方法有权

公开(公告)号：CN114782961B

公开(公告)日：2023-04-18

申请号：CN202210285238.8

申请日：2022-03-23

Applicant: 华南理工大学 , 人工智能与数字经济广东省实验室(广州)

Inventor： 黄双萍 , 黄鸿翔 , 杨代辉

IPC: G06V30/19 , G06T3/00 , G06N3/0464 , G06N3/048 , G06N3/094

Abstract: 本发明公开了一种基于形状变换的字符图像增广方法，包括以下步骤：构建形状变换生成对抗网络，包括生成器和判别器；以原始字符图像作为生成器的输入，经过空间变换之后产生形变的字符图像，将生成器的输出端与判别器的输入端连接，同时，将目标字符图像输入到判别器的另一个输入端，判别器输出对形变的字符图像和目标字符图像的判别结果；训练所述的形状变换生成对抗网络；使用训练好的生成器生成增广后的字符图像。本发明方法结合仿射矩阵和TPS变换采样网格参数使STN能够同时产生全局和局部的形状变化，能够更好的拟合字符的形状特征，使产生的字符真实性和多样性更好，使用增广后的数据所训练的分类器的分类性能进一步提升。

5.

发明授权
一种联合形状变换和纹理转换的古文字生成方法有权

公开(公告)号：CN114494003B

公开(公告)日：2022-06-21

申请号：CN202210336338.9

申请日：2022-04-01

Applicant: 华南理工大学 , 人工智能与数字经济广东省实验室(广州)

Inventor： 黄双萍 , 黄鸿翔 , 杨代辉

IPC: G06T3/00 , G06T11/20 , G06T11/40 , G06N3/04 , G06N3/08

Abstract: 本发明公开了一种联合形状变换和纹理转换的古文字生成方法，包括：构建形状变换生成对抗网络A，包括生成器A1和判别器A2；构建纹理转换生成对抗网络B，包括生成器B1、判别器B2、生成器B3和判别器B4，纹理转换生成对抗网络B为循环生成对抗网络；将形状变换生成对抗网络A和纹理转换生成对抗网络B进行连接，获得摄影古文字生成网络模型；联合训练摄影古文字生成网络模型中的形状变换生成对抗网络A和纹理转换生成对抗网络B；使用训练好的生成器A1和生成器B1，将生成器A1的输出端与生成器B1输入端相连，获得摄影古文字图像生成器；采用所述的摄影古文字图像生成器进行古文字生成。

6.

发明公开
一种联合形状变换和纹理转换的古文字生成方法有权

公开(公告)号：CN114494003A

公开(公告)日：2022-05-13

申请号：CN202210336338.9

申请日：2022-04-01

Applicant: 华南理工大学 , 人工智能与数字经济广东省实验室(广州)

Inventor： 黄双萍 , 黄鸿翔 , 杨代辉

IPC: G06T3/00 , G06T11/20 , G06T11/40 , G06N3/04 , G06N3/08

Abstract: 本发明公开了一种联合形状变换和纹理转换的古文字生成方法，包括：构建形状变换生成对抗网络A，包括生成器A1和判别器A2；构建纹理转换生成对抗网络B，包括生成器B1、判别器B2、生成器B3和判别器B4，纹理转换生成对抗网络B为循环生成对抗网络；将形状变换生成对抗网络A和纹理转换生成对抗网络B进行连接，获得摄影古文字生成网络模型；联合训练摄影古文字生成网络模型中的形状变换生成对抗网络A和纹理转换生成对抗网络B；使用训练好的生成器A1和生成器B1，将生成器A1的输出端与生成器B1输入端相连，获得摄影古文字图像生成器；采用所述的摄影古文字图像生成器进行古文字生成。

Search Results

Country/Region

Patent validity

Application date

Publication (announcement) day

applicant

The country/region where the applicant is located

Inventor

IPC

IPC Department

IPC class

IPC subclass

IPC group

IPC team

Appearance classification