-
公开(公告)号:CN116596961A
公开(公告)日:2023-08-15
申请号:CN202310371679.4
申请日:2023-04-10
Applicant: 华南农业大学
IPC: G06T7/246 , G06V10/764 , G06V10/774 , G06V10/80 , G06N3/0464 , G06N3/08
Abstract: 本发明公开了基于全局空洞注意力和目标聚焦的单目标跟踪方法及装置,方法包括:获取“模板图像‑搜索图像”的图像对;对模板图像与搜索图像进行特征提取,得到模板图像特征和搜索图像特征;构建基于全局空洞注意力的全局目标聚焦网络;全局空洞注意力用于对模板和搜索区域特征进行有效的特征增强,目标聚焦网络用于在模板和搜索区域之间建立点对点的关联,将信息从模板传递到搜索区域;将增强后的目标特征输入到基于互相关的预测头中以产生目标区域。本发明构建了一种全新的全局语义建模方法来增强语义对象,消除背景信息干扰,并且实现搜索区域中目标特征的部分级增强,有效地增强了目标嵌入,同时削弱非目标物体,实现鲁棒的目标跟踪。
-
公开(公告)号:CN119516249A
公开(公告)日:2025-02-25
申请号:CN202411464089.7
申请日:2024-10-21
Applicant: 华南农业大学
IPC: G06V10/764 , G06V10/82 , G06N3/0455 , G06V10/774 , G06V10/776 , G06V10/40 , G06V10/30 , G06V10/75 , G06T7/00
Abstract: 本发明公开了一种基于变分自编码器与去噪网络的多类别缺陷检测方法及装置,方法包括:获取工业产品表面缺陷图像并进行预处理,构建训练集和验证集;方法的训练过程分为两个阶段:第一阶段,将预处理后的训练图像输入变分自编码器进行训练,学习图像的特征分布,并通过重建图像来捕捉正常图像的特征。第二阶段,利用去噪网络与特征引导模块在变分自编码器的特征空间中对图像特征进行二次重建,从而增强模型的重建能力和多类别重建能力;在推理阶段,通过特征提取器提取原始图像与重建图像的多尺度特征,进行特征比对,生成异常评分图。本发明在增强变分自编码器重建能力的同时保留正常信息,有效减少重建失败而导致的缺陷漏检。
-
公开(公告)号:CN116645535A
公开(公告)日:2023-08-25
申请号:CN202310470637.6
申请日:2023-04-27
Applicant: 华南农业大学
IPC: G06V10/762 , G06V10/26 , G06V10/426 , G06V10/44 , G06V10/46 , G06V10/75 , G06V10/74 , G06V10/82 , G06V10/80
Abstract: 本发明公开了一种基于超图学习的图案元素分组方法及装置,方法包括:对图案进行预处理操作,获取图案中元素的图像分割结果;提取图案元素的格式塔规则特征,包括相似性、邻近性、连续性和混合式特征;使用超图建模图案元素之间基于不同格式塔规则的相关性;设计自适应的超图融合方法,获得融合多种格式塔规则的超图;使用基于超图学习和用户引导的标签传播方法,来获得图案的分组结果。本发明提出格式塔分组规则在图案元素上的表示,同时根据不同分组规则,利用超图建模图案元素之间的连接关系,并使用超图进行统一表示,实现格式塔规则的融合,有效地解决格式塔规则冲突的问题,并实现根据用户的分组意图来对图案元素进行个性化分组。
-
公开(公告)号:CN119273657A
公开(公告)日:2025-01-07
申请号:CN202411366557.7
申请日:2024-09-29
Applicant: 华南农业大学
IPC: G06T7/00 , G06V10/74 , G06V10/774 , G06V10/82 , G06N3/045 , G06N3/0464 , G06N3/0475 , G06N3/0895 , G06N3/094
Abstract: 本发明公开了一种基于两阶段对比学习的工业零部件缺陷检测方法及装置,包括:采集工业零部件的图像数据集;生成多样性的合成异常样本;通过第一阶段的训练得到一个具有粗粒度异常定位能力的判别网络,所述判别网络用于辅助特征提取网络的训练过程;第二阶段的训练,使用对比学习框架来完成特征提取网络的适应性微调,学习正常样本之间的相似性以及正常样本与合成异常样本之间的差异性;构建一个只含有正常特征的压缩特征内存库,基于压缩特征内存库和训练好的缺陷检测模型对待检测的工业零部件进行缺陷检测。本发明基于两阶段对比学习方式,考虑每个正常的工业零部件之间的相关性,以及正常与异常零部件之间的差异性,保证缺陷检测的精度。
-
公开(公告)号:CN116645498A
公开(公告)日:2023-08-25
申请号:CN202310372669.2
申请日:2023-04-10
Applicant: 华南农业大学
IPC: G06V10/22 , G06V10/762 , G06V10/80 , G06N3/0464 , G06N3/082
Abstract: 本发明公开了一种基于深度学习的柑橘类果实采摘定位方法、系统及设备,包括:利用目标检测模型对摄像头拍摄的场景进行果实检测;基于果实检测结果对拍摄场景进行近景、远景场景的判定;对远景场景的果实进行聚类算法,实现镜头由远景场景向近景场景的转换;利用先验法,获取果实与枝条的相对位置;对近景场景内与果实相连接的枝条通过改进的实例分割算法进行分割;根据果实检测结果、果实与枝条的相对位置和枝条分割结果,通过采摘点定位算法,得到果实采摘点的坐标,并控制机械臂完成果实的自动化采摘。本发明通过添加图像亮度、果叶长势先验改进SparseInst算法的IAM部分,让聚合实例特征的位置准确聚焦于目标枝条,提高分割算法的准确性与实时性。
-
公开(公告)号:CN116597195A
公开(公告)日:2023-08-15
申请号:CN202310372198.5
申请日:2023-04-10
Applicant: 华南农业大学
IPC: G06V10/764 , G06V10/80 , G06V10/82 , G06N3/0464 , G06N3/048 , G06N3/08
Abstract: 本发明公开了一种高准确率的果实产量估算方法、系统及设备,包括:S1、采集果实种植区域中的远景图像以及同一区域的近景图像,并将所述远景图像和近景图像进行图像数据扩充,以扩增图像数据的数量和多样性;S2、将所述远景图像和近景图像输入至预先设立的产量估算网络模型中,学习远景图像和近景图像的信息关联性,得到果实的产量估算值;所述产量估算模型是使用改进的YOLOv5检测模型;S3、将所述果实的产量估算值输入到预先设立的专家系统中进行修正,得到精确的产量估算结果。本发明通过从远近景产量估算结合的角度入手,考虑到局部产量和全局产量存在的联系,通过学习其中的关联性来提高了产量预估的准确性。
-
-
-
-
-