-
公开(公告)号:CN118823348A
公开(公告)日:2024-10-22
申请号:CN202410912562.7
申请日:2024-07-09
Applicant: 电子科技大学
IPC: G06V10/26 , G06V20/70 , G06V20/17 , G06V10/20 , G06V10/82 , G06T5/10 , G06N3/0895 , G06N3/0464 , G06N3/045
Abstract: 本发明提出了一种基于半监督的无人机航空图像分割方法。具体而言,该方法的核心创新体现在四个方面,首先是数据增强,采用基于傅里叶变换的策略,该策略通过在频域对图像进行处理,增强了模型对于图像特征的学习能力,尤其是在处理复杂背景和细节信息时的准确性。其次是,置信度优化方面改进了置信度评估方法,以更精确地处理标签不确定性。这一改进有助于模型在训练过程中减少误差传播,确保了使用高置信度标签,从而提升了学习效率和分割质量。再而是双网络预测结构,通过双网络结构的设计,算法能够并行处理图像数据,综合两个网络的预测结果。这种结构不仅提高了模型对图像特征的捕捉能力,也增强了模型在面对不同场景时的泛化能力。最后对损失函数进行了创新设计,以更好地优化模型训练过程。新的损失函数设计针对性强,旨在增强模型对不同尺度、形状目标的分割能力,以及提高前景与背景的区分效果。
-
公开(公告)号:CN118821852A
公开(公告)日:2024-10-22
申请号:CN202410911680.6
申请日:2024-07-09
Applicant: 电子科技大学
IPC: G06N3/0455 , G06N3/0464 , G06N5/04 , G06V10/52 , G06V10/42 , G06V10/44 , G06V10/82 , G06V40/20 , G06V10/25 , G06V10/764 , G06V20/70
Abstract: 本发明涉及计算机视觉与深度学习技术的前沿领域,提出了一种基于多尺度上下文聚合与多重关系复用的创新网络架构。该网络通过精心设计,能够高效地整合图像中不同尺度的上下文信息,从全局背景到局部细节进行全面捕捉,进而提升对复杂场景的理解能力。同时,网络内部实现了多重关系的复用,增强了跨层级特征之间的交互与融合,有效提升了图像识别、分割及增强等任务的精度与效率。特别地,在人体‑物体交互(HOI)检测等高级视觉任务中,本发明的网络展现出卓越的性能,为相关领域的研究与应用提供了强有力的技术支撑。
-
公开(公告)号:CN118721188A
公开(公告)日:2024-10-01
申请号:CN202410797503.X
申请日:2024-06-20
Applicant: 电子科技大学
IPC: B25J9/16
Abstract: 本项发明针对传统机械臂避障路径规划方法存在的问题提出了一种创新的局部路径重规划算法,融合了RRT、APF和VF‑RRT方法,以应对动态和静态障碍物环境的挑战。其技术方案如下:首先,通过点云数据跟踪和RGB‑D相机捕捉工作空间的环境信息,生成了静态和动态障碍物的三维点云模型。接着,利用迭代最近点算法跟踪静态障碍物,以及通过在线图像与离线背景相减获取的点云信息分类和跟踪动态障碍物。针对可能影响危险路径的障碍物,创建保护区域,仅对最接近的障碍物进行局部路径重规划,以减少计算量。然后,基于机械臂运动模型和碰撞检测方法,通过随机树路径回源更新算法优化初始路径,获得可执行路径。最后,结合APF和RRT方法,采用递归重规划和动态调整比例的策略,实现对动态障碍物的安全路径重规划。这一发明在处理机械臂避障问题上具有创新性和实用性,能够有效地解决复杂环境下的避障挑战。
-
公开(公告)号:CN118823347A
公开(公告)日:2024-10-22
申请号:CN202410912558.0
申请日:2024-07-09
Applicant: 电子科技大学
IPC: G06V10/26 , G06V20/70 , G06V20/17 , G06V10/82 , G06V10/44 , G06V10/54 , G06V10/80 , G06N3/0455 , G06N3/0464
Abstract: 本发明提出了一种专为无人机航拍图像分割任务设计的先进U‑Net网络改进模型。该模型通过融合边缘感知能力与先进的注意力机制,显著增强了对图像边缘区域的分割精度及整体图像的分割性能。通过引入创新的双重注意力机制,模型能够更加聚焦于图像的关键部分,有效减少由背景元素引起的干扰,同时显著提升了分割的准确度。此外,模型中加入的门控注意力技术在实现特征的选择与融合过程中优化了跳跃连接,加之边缘感知模块的引入,极大地提高了模型对图像边缘细节的捕捉能力,确保了分割结果的清晰度与精确性。为了进一步提高分割质量,本模型在解码器部分采用了改进的特征融合技术,这一策略确保了深层与浅层特征的有效结合,捕获了丰富的上下文信息,从而在性能上得到了显著提升。
-
公开(公告)号:CN118229957A
公开(公告)日:2024-06-21
申请号:CN202410387185.X
申请日:2024-04-01
Applicant: 电子科技大学
IPC: G06V10/25 , G06N3/0455 , G06N3/0495 , G06N3/082 , G06N3/047 , G06V10/74 , G06V10/764
Abstract: 本发明旨在解决现有方法在处理复杂、实时计算的应用场景时存在的问题。本发明对Transformer进行了轻量化改进,同时改进了损失函数以克服长尾数据集问题。具体技术方案包括:主干网络采用Transformer,并包含增强高频局部信息的注意力机制风格模块、全局‑局部的互补注意力机制以及二维注意力融合的前馈网络。本发明提出了基于深度卷积的高频局部分支LBConv,用于捕捉高频局部信息;将有价值的全局依赖关系聚集到一个小的特征空间,然后将聚合后的全局信息广播到局部特征中。同时引入可学习的全局token聚合局部token的信息并提出了一个二维注意力模块来显式地聚合空间维度和通道维度之间的全局依赖关系;引入基于角度的边界类别感知损失函数ACP Loss,将决策边界推向尾部类别。
-
-
-
-