-
公开(公告)号:CN116403127A
公开(公告)日:2023-07-07
申请号:CN202310210638.7
申请日:2023-03-06
Applicant: 华南理工大学 , 广东微步智能科技有限公司
Abstract: 本发明公开了一种无人机航拍图像目标检测方法、装置和存储介质,其中方法包括:主干网络对无人机航拍图像进行特征提取,获得初步特征;使用跨阶段局部空洞空间金字塔池化模块获得不同感受野的特征,并进行通道聚合,得到深层特征;将得到的深层特征输入到路径聚合网络模块中进行特征融合,并使用坐标注意力多尺度堆叠模块提取到更加丰富的空间位置信息,得到不同尺度的特征表示;将不同尺度的特征表示通过卷积模块和非线性激活函数进行目标分类和边界框回归。本发明通过采用坐标注意力多尺度堆叠模块在实现多尺度提取特征的同时将坐标信息注入到通道中,保留了更多的细节信息来帮助图像中小目标的检测。本发明可广泛应用于目标检测领域。
-
公开(公告)号:CN118247686A
公开(公告)日:2024-06-25
申请号:CN202410284007.4
申请日:2024-03-13
Applicant: 华南理工大学
Abstract: 本发明公开了一种图像检测模型的训练方法、识别方法、系统、设备及介质,其中,该训练方法通过获取标注好的航拍图像集;对所述航拍图像集进行映射提取处理,得到初步特征集;对所述初步特征集进行双向多尺度融合处理,得到多尺度特征集;将所述多尺度特征集输入至初始化的图像检测模型中进行训练,得到训练好的图像检测模型。该训练方法可以提高图像检测模型对无人机航拍图像的特征提取能力,进而提高对无人机航拍图像的检测效果,以及,降低训练图像检测模型所需的计算资源。本发明可广泛应用于目标检测技术领域。
-
公开(公告)号:CN114581662B
公开(公告)日:2024-04-09
申请号:CN202210147766.7
申请日:2022-02-17
Applicant: 华南理工大学 , 广东微步智能科技有限公司
IPC: G06V10/26 , G06V10/80 , G06V10/82 , G06N3/0464 , G06N3/0455 , G06N3/048 , G06N3/08
Abstract: 本发明公开了一种脑肿瘤图像的分割方法、系统、装置及存储介质,其中方法包括:对脑肿瘤图像及标签进行预处理和数据扩增;对脑肿瘤图像进行卷积及下采样,提取脑肿瘤图像中的上下文语义信息,获得特征图;对特征图进行上采样,将上采样的图与同一层级编码器模块中的特征进行特征融合;将特征图通过特征金字塔融合模块进行聚合,并输入到期望最大化自注意力模块中学习全局上下文信息;将特征和最大层级特征图进行聚合,得到最终的语义分割结果。本发明基于多尺度通道注意力机制,提取特征和进行特征融合,采用特征金字塔和期望最大化注意力机制来提取全局上下文信息,提高语义分割的精度,可广泛应用于计算机视觉及图像处理领域。
-
公开(公告)号:CN114581662A
公开(公告)日:2022-06-03
申请号:CN202210147766.7
申请日:2022-02-17
Applicant: 华南理工大学 , 广东微步智能科技有限公司
Abstract: 本发明公开了一种脑肿瘤图像的分割方法、系统、装置及存储介质,其中方法包括:对脑肿瘤图像及标签进行预处理和数据扩增;对脑肿瘤图像进行卷积及下采样,提取脑肿瘤图像中的上下文语义信息,获得特征图;对特征图进行上采样,将上采样的图与同一层级编码器模块中的特征进行特征融合;将特征图通过特征金字塔融合模块进行聚合,并输入到期望最大化自注意力模块中学习全局上下文信息;将特征和最大层级特征图进行聚合,得到最终的语义分割结果。本发明基于多尺度通道注意力机制,提取特征和进行特征融合,采用特征金字塔和期望最大化注意力机制来提取全局上下文信息,提高语义分割的精度,可广泛应用于计算机视觉及图像处理领域。
-
-
-