一种基于优化深度网络的古文字样本采集、检测和识别方法

    公开(公告)号:CN117095401A

    公开(公告)日:2023-11-21

    申请号:CN202311008755.1

    申请日:2023-08-11

    Abstract: 本发明提供了一种基于优化深度网络的古文字样本采集、检测和识别方法。首先,进行数据采集和样本标注,并通过迭代采集的方法扩充和更新数据库,搭建古文字拓片摹本和单字数据库,弥补古文字图像数据库的缺乏。其次,选择CycleGAN对古文字摹本和拓片进行跨域图像转换,从风格迁移的角度扩充数据,并在此基础上进行古文字目标检测。在批量古文字图像上进行目标检测,可将对古文字的识别从单字转换为整片识别,提升了技术的实用性。此外,在搭建的古文字单字数据库的基础上,针对其长尾分布的特性,采用Mixup方法生成新的样本数据。再使用四种深层网络模型进行训练,最后建立一种决策级融合识别模型,完成古文字采集、检测和识别的目标。

Patent Agency Ranking