基于多粒度解码约束的缅甸语图像文本识别方法及装置

    公开(公告)号:CN119580268A

    公开(公告)日:2025-03-07

    申请号:CN202510064855.9

    申请日:2025-01-15

    Abstract: 本发明涉及基于多粒度解码约束的缅甸语图像文本识别方法及装置,属于自然语言处理领域。缅甸语文本具有独特的编码顺序以及字符组合规则,为了解决缅甸语图像中形似字符识别不佳的问题,提出一种基于多粒度解码约束的缅甸语文本图像识别方法,主要由缅甸语文本图像数据集构建及预处理、设计包括基于滑动窗口的Transformer、语言特性驱动的多粒度特征抽取模块、多粒度特征融合模块的基于多粒度解码约束的缅甸语文本图像识别模型以及缅甸语文本图像识别四个部分构成。根据这四个部分功能模块化制成基于多粒度解码约束的缅甸语图像文本识别装置,有效地解决了因图像质量不佳而导致的缅甸语形似字符识别困难问题。

Patent Agency Ranking