基于位置森林变换器的手写数学表达式识别方法

    公开(公告)号:CN118587720A

    公开(公告)日:2024-09-03

    申请号:CN202410737906.5

    申请日:2024-06-07

    Abstract: 一种基于位置森林变换器的手写数学表达式识别方法,包括:构建位置森林结构,并利用该位置森林结构来编码LaTeX表达式中符号间的相对位置关系,从而预测数学表达式的LaTeX序列;构建隐式注意力校正模块,在基于序列的解码器架构中修正结构符号的干扰,捕捉手写数学表达式图像识别的注意力;基于这个框架进行训练;将待识别图像输入到训练后的位置森林变换器模型中,得到数学公式的Latex表达式。本发明不需要额外的数据标注,通过解析每个符号在位置森林中的位置标识符,准确地描述符号的位置和层次关系,一定程度上克服了复杂结构关系和多样化手写风格带来的挑战,提高了手写数学公式的识别准确率,而且没有额外的延迟或计算成本。

Patent Agency Ranking