-
公开(公告)号:CN118691960A
公开(公告)日:2024-09-24
申请号:CN202410811421.6
申请日:2024-06-21
Applicant: 桂林电子科技大学 , 桂林慧谷人工智能产业技术研究院
IPC: G06V20/05 , G06V10/42 , G06V10/44 , G06V10/52 , G06V10/80 , G06V10/82 , G06V10/764 , G06N3/0455 , G06N3/0464 , G06N3/08
Abstract: 本发明公开一种基于ViT机制和面向场景搜索的水下目标检测方法,涉及海参、海胆、扇贝和海星的目标检测技术领域,方法包括:将预处理后的待检测水下目标图像的水下目标图像数据集输入至面向场景搜索模块生成全局特征计算模型,输入至基于ViT的编码模块生成局部特征计算模型;将预处理后的水下目标图像数据集输入至全局特征计算模型确定水下目标图像数据集的全局特征信息图谱,输入至局部特征计算模型确定水下目标图像数据集的局部特征信息图谱;将全局特征信息图谱与局部特征信息图谱输入至特征融合层生成多通道特征信息图谱;将多通道特征信息图谱输入至目标预估模块确定待检测水下目标图像中的目标类别预测结果。