-
公开(公告)号:CN114648770B
公开(公告)日:2024-11-19
申请号:CN202210354142.2
申请日:2022-04-06
Applicant: 华南理工大学
IPC: G06V30/40 , G06V10/774 , G06V10/764 , G06V30/10
Abstract: 本发明公开了一种古籍文档顺序检测方法,包括:获取图像数据,基于图像数据进行各个字符的连接顺序标注以及整个文档的文本行顺序标注,获得训练数据集;基于训练数据集,通过空间几何关系构造图的邻接矩阵,构造图中各个结点的特征以及边特征,训练字符连接关系预测模型,得到将字符连接后的文本行;基于训练数据集,通过编码‑解码的序列模型,构建并训练文本行顺序预测模型,获得文本行顺序预测结果;根据图像数据,基于训练字符连接关系预测模型和训练文本行顺序预测模型,获得图像数据的符合阅读顺序的文档内容。本发明针对密集字符型的文档图片,基于字符检测结果进行顺序检测,提出包括单字连接关系预测模型以及文本行顺序预测模型。
-
公开(公告)号:CN114943204A
公开(公告)日:2022-08-26
申请号:CN202210599644.1
申请日:2022-05-30
Applicant: 华南理工大学
IPC: G06F40/109 , G06T5/50 , G06N3/04
Abstract: 本发明提供了一种基于生成对抗网络的中文字体合成的方法,包括:基于不同字体风格的不同字符类别构建训练集与测试集;基于生成对抗网络构建中文字体合成模型;基于所述训练集对所述中文字体合成模型进行训练,将所述测试集输入训练后的所述中文字体合成模型,获取字体合成结果。本发明利用深度学习网络对图像进行特征提取,以及利用组件感知模块为生成器提供有效的部件级监督,具有实现简单、推理速度快、生成质量高等优点。
-
公开(公告)号:CN114648770A
公开(公告)日:2022-06-21
申请号:CN202210354142.2
申请日:2022-04-06
Applicant: 华南理工大学
IPC: G06V30/40 , G06K9/62 , G06V10/774 , G06V10/764 , G06V30/10
Abstract: 本发明公开了一种古籍文档顺序检测方法,包括:获取图像数据,基于图像数据进行各个字符的连接顺序标注以及整个文档的文本行顺序标注,获得训练数据集;基于训练数据集,通过空间几何关系构造图的邻接矩阵,构造图中各个结点的特征以及边特征,训练字符连接关系预测模型,得到将字符连接后的文本行;基于训练数据集,通过编码‑解码的序列模型,构建并训练文本行顺序预测模型,获得文本行顺序预测结果;根据图像数据,基于训练字符连接关系预测模型和训练文本行顺序预测模型,获得图像数据的符合阅读顺序的文档内容。本发明针对密集字符型的文档图片,基于字符检测结果进行顺序检测,提出包括单字连接关系预测模型以及文本行顺序预测模型。
-
-