-
公开(公告)号:CN113901879A
公开(公告)日:2022-01-07
申请号:CN202111069493.0
申请日:2021-09-13
Applicant: 昆明理工大学
Abstract: 本发明涉及融合多尺度语义特征图的缅甸语图像文本识别方法及装置,属于自然语言处理领域。针对缅甸语图像字符的结构特点,本发明提出了一种融合多尺度语义特征图的缅甸语图像文本识别方法,主要包括缅甸语图像文本数据预处理、融合多尺度语义特征图的缅甸语识别模型、基于MIX UP数据增强策略的缅甸语图像文本识别模型训练、缅甸语图像文本识别等四个部分构成。本发明所提方法能够有效地融合缅甸语图像的字符结构特征提升缅甸语图像文本识别模型性能,对东南亚图像文本识别具有理论和实际应用价值。
-
公开(公告)号:CN112287920B
公开(公告)日:2022-06-14
申请号:CN202010978722.X
申请日:2020-09-17
Applicant: 昆明理工大学
IPC: G06V10/22 , G06V10/774 , G06V10/82 , G06K9/62 , G06F40/126 , G06N3/04 , G06N3/08
Abstract: 本发明涉及基于知识蒸馏的缅甸语OCR方法。本发明包括如下步骤:构建适应任务需求的缅甸语图像数据集;对生成的图像加噪,对图像所对应的标签编码进行规则性标注;构建使用深度卷积神经网络和循环神经网络框架的学生网络和教师网络的模型架构;基于知识蒸馏的方法将教师网络与学生网络以集成学习的方式进行联合训练,通过教师集成的子网络与学生网络进行耦合,实现学生网络中单个感受野对应的局部字符图像特征与教师网络中整体字符图像特征的对齐,以此增强对长序列字符图像中局部特征的获取,使学生网络通过调用服务器上的部署模型能够高效识别缅甸语复杂场景文本图像。本发明实现了对缅甸语图像文本的识别,且识别精确率高,效果好。
-
公开(公告)号:CN112287920A
公开(公告)日:2021-01-29
申请号:CN202010978722.X
申请日:2020-09-17
Applicant: 昆明理工大学
IPC: G06K9/20 , G06K9/62 , G06F40/126 , G06N3/04 , G06N3/08
Abstract: 本发明涉及基于知识蒸馏的缅甸语OCR方法。本发明包括如下步骤:构建适应任务需求的缅甸语图像数据集;对生成的图像加噪,对图像所对应的标签编码进行规则性标注;构建使用深度卷积神经网络和循环神经网络框架的学生网络和教师网络的模型架构;基于知识蒸馏的方法将教师网络与学生网络以集成学习的方式进行联合训练,通过教师集成的子网络与学生网络进行耦合,实现学生网络中单个感受野对应的局部字符图像特征与教师网络中整体字符图像特征的对齐,以此增强对长序列字符图像中局部特征的获取,使学生网络通过调用服务器上的部署模型能够高效识别缅甸语复杂场景文本图像。本发明实现了对缅甸语图像文本的识别,且识别精确率高,效果好。
-
-