一种基于注意力机制的目标检测和图像增强方法

    公开(公告)号:CN118736587A

    公开(公告)日:2024-10-01

    申请号:CN202410864369.0

    申请日:2024-06-30

    Abstract: 本发明公开了一种基于注意力机制的目标检测和图像增强方法,包括以下步骤:步骤1,制作文本框检测数据集,并根据文本框标注规则标注数据集中每张图片的文本框位置,数据集中包括不同光照强度、不同拍摄角度、不同文本形式的样本;步骤2,建立基于注意力机制的文本框检测模型,通过文本框检测模型进行目标检测得到文本框的位置;步骤3,检测到文本框的位置后,根据光照强度采用相应的图像增强算法对文本框进行局部增强,进行后续的文本识别。本发明通过建立一种基于注意力机制的目标检测模型实现了目标文本框的快速和稳定检测,还通过局部图像增强大大减轻了自然场景下图像成像条件复杂等因素对后续文本识别的影响。

Patent Agency Ranking