基于Transformer的无人机视觉处理方法、装置及存储介质

    公开(公告)号:CN119131617A

    公开(公告)日:2024-12-13

    申请号:CN202311830725.9

    申请日:2023-12-27

    Abstract: 本发明涉及基于Transformer的无人机视觉处理方法、装置及存储介质,其中方法包括:安装在无人机上的图像采集设备采集图像;基于骨干网络Swin Transformer,通过YOLO目标检测算法,提取图像的高层特征表示;基于特征金字塔网络,处理图像在不同尺度的特征,生成多尺度的特征图;基于图像在每个尺度上的检测头,预测目标的类别和边界框;基于YOLO的锚框,生成图像的预测边界框。本发明通过基于Transformer的无人机视觉处理方法和装置,能克服现实的场景中,将目标检测应用在无人机上,由于场景的变换、拍摄畸变、目标遮挡等因素造成目标检测极为困难,提取出相对优秀的图像处理结果。

Patent Agency Ranking