-
公开(公告)号:CN116342857A
公开(公告)日:2023-06-27
申请号:CN202310336796.7
申请日:2023-03-28
Applicant: 武汉大学 , 长江勘测规划设计研究有限责任公司
IPC: G06V10/22 , G06V10/40 , G06V10/74 , G06V10/764 , G06V10/774 , G06V10/82 , G06N3/0895
Abstract: 本发明属于计算机视觉领域,尤其涉及一种基于类别修正的弱监督目标定位方法。为了解决CAM技术的定位不准确的弊端,我们不再利用类别特征图进行定位,而采用由粗略到精细的流程。本发明的模型由主干网络、定位网络和分类网络组成,首先由定位网络利用无监督分割技术生成类别无关的分割图,从而确定目标物体的粗略位置。之后由分类网络再通过类别标签进行细粒度修正。此种基于类别修正的方法可以精准的定位物体,对于轮廓细节也可以进行很好的识别。
-
公开(公告)号:CN120071134A
公开(公告)日:2025-05-30
申请号:CN202510097098.5
申请日:2025-01-22
Applicant: 武汉大学
IPC: G06V20/10 , G06V10/52 , G06V10/80 , G06V10/82 , G06N3/09 , G06N3/096 , G06N3/0455 , G06N3/0464
Abstract: 本发明公开了一种基于预训练编码器网络的遥感图像建筑提取方法及系统,使用预训练编码器从遥感影像中提取多尺度特征,输入密集连接的粗到细特征融合模块,快速高效地聚合多尺度信息,并生成建筑预测图。在模型学习过程中,使用了纯净掩码监督和知识蒸馏技术,增强了网络从深度监督中学习有价值信息的能力;本发明仅需较小的计算资源即可实现高效的多尺度特征整合,避免了传统方案中因计算资源消耗过大而导致的性能瓶颈。此外,通过纯净掩码引导深度监督与知识蒸馏从纯净标签区域进行学习,提升模型收敛效率。在这种机制下,能够在较低的计算成本下实现高性能的建筑物轮廓提取,从而避免因计算资源不足导致的精度下降问题。
-
公开(公告)号:CN119762963A
公开(公告)日:2025-04-04
申请号:CN202411770715.5
申请日:2024-12-04
Applicant: 武汉大学
Abstract: 本发明公开了一种基于单时相语义分割的变化检测预训练方法和系统,属于遥感影像检测技术领域。首先,该方法使用广泛的单时相语义分割数据构造伪双时相变化检测数据,随后在任意一种深度学习变化检测网络中引入一个语义分割检测模块构成预训练网络,在伪双时相变化检测数据上进行预训练,随后将得到的预训练模型在真实的变化检测数据集上进行微调得到最终的变化检测模型。本发明有效利用丰富的单时相语义分割数据来构造伪双时相变化检测数据,从而缓解了基于深度学习的遥感影像变化检测方法对大规模双时相标注数据的依赖;本发明在预训练阶段额外设计了一个语义分割检测模块加强模型对变化目标语义的理解能力,从而提升了模型的检测精度。
-
公开(公告)号:CN119511404A
公开(公告)日:2025-02-25
申请号:CN202411569498.3
申请日:2024-11-05
Applicant: 武汉大学
Abstract: 本发明提出了一种基于组网协同配合的深海水下目标探测方法、装置、设备及介质,涉及深海捕捞作业领域,该方法包括:以多艘渔船协同配合建立探测组网;放飞预设数量的跨介质飞行器并捕捉水下目标的水下目标信号,根据探测位置信息令跨介质飞行器接近水下目标并确定水下目标是否为鱼群目标以及鱼群目标是否为捕捞鱼群种类;令跨介质飞行器对鱼群目标进行持续跟踪;获取鱼群目标的探测信号以及鱼群目标所在位置的海洋环境信息,并根据海洋环境信息以及探测信号,确定鱼群目标是否适合捕捞;根据鱼群目标的种类确定适宜捕捞环境参数建立捕捞组网,并根据捕捞组网指导渔船进行捕捞作业。本发明避免了单船捕捞过程中水下目标探测过程的丢失,提升深海捕捞的效率和科学性。
-
公开(公告)号:CN119474464A
公开(公告)日:2025-02-18
申请号:CN202411375676.9
申请日:2024-09-29
Applicant: 武汉大学
IPC: G06F16/901 , G06F16/903
Abstract: 本申请涉及计算机技术领域,特别涉及一种图形处理器的三角形计数实现方法及装置,其中,方法包括:获取图形处理器的图形数据;识别图形数据中所有顶点的邻居列表,根据所有顶点的邻居列表以无需锁的方式构建哈希树,建立所有顶点对应哈希树的索引数组;当访问目标图顶点时,并行遍历目标图顶点的所有邻居图节点,并将所有邻居图节点的邻居列表映射至连续内存区域;基于索引数组和连续内存区域实现三角形计数。由此,解决了相关技术中三角形计数时GPU计算能力、计算效率及访存效率差等问题。
-
公开(公告)号:CN114647794B
公开(公告)日:2024-11-08
申请号:CN202210245140.X
申请日:2022-03-14
Applicant: 武汉大学
IPC: G06F16/9536 , G06F16/958 , G06F18/241 , G06F18/214 , G06N3/0455 , G06N3/084 , G06N3/0895 , G06N3/088
Abstract: 本发明公开了一种协同过滤推荐方法、服务器及存储介质,涉及信息推荐技术领域。方法包括以下步骤:训练样本,获得用户和项目向量集合;使用自动编码器对向量进行编码和解码,获得潜在表征集合;计算潜在表征的元素乘积φ1;级联用户‑项目潜在表征,作为多层感知器的输入,计算输出值φ2;级联φ1和φ2,并计算预测评分#imgabs0#构建损失函数,优化求解模型参数;迭代重复,直至模型收敛,输出协同过滤推荐模型。与现有技术相比,本发明的优点如下:本发明充分利用用户‑项目评分信息,获得更好的用户‑项目表示。具有适应度高、优化问题易于求解的特点,可以有效解决协同过滤推荐问题并实现更好的推荐性能。
-
公开(公告)号:CN118210896A
公开(公告)日:2024-06-18
申请号:CN202410335971.5
申请日:2024-03-22
Applicant: 武汉大学
IPC: G06F16/332 , G06N3/045 , G06N20/00 , G06F40/205
Abstract: 本发明公开了一种基于大语言模型的强化学习自动构建提示词方法及装置,涉及人工智能领域,该方法包括进行强化学习任务相关基本信息的设定;实时更新强化学习中的状态模块和记忆模块,以用于在决策过程中实时更新每一步决策的状态,以及基于以往决策轨迹优化决策表现;将强化学习生成的提示词组合成完整提示词,基于完整提示词向大语言模型提问并获取答案;对获取的答案进行解析,以进行答案格式合法性的判断和答案正确性的判断。本申请能够根据强化学习问题自动构建提示词,同时对于大语言模型的回答能够做到自动解析和执行,具有成本低、效率高、泛化性高和稳定性强的特点。
-
公开(公告)号:CN118072252A
公开(公告)日:2024-05-24
申请号:CN202410463169.4
申请日:2024-04-17
Applicant: 武汉大学
IPC: G06V20/52 , G06V10/764 , G06V10/774 , G06V10/75 , G06V10/82
Abstract: 本申请提供一种适用于任意多模态数据组合的行人重识别模型训练方法,多模态分词器针对任意预设模态或预设模态组合的行人数据都可以分别得到单模态嵌入矩阵,并且串联形成对应的混合嵌入矩阵,多模态特征提取器采用的基础模型基于Transformer架构,具备处理变长输入的能力,且在大规模数据集上经过预训练,故可以针对任意混合嵌入矩阵得到对应的混合特征矩阵。由于基础模型的参数冻结,在行人重识别模型的训练过程中主要针对多模态分词器中的多个分词器准备训练样本集和设置损失函数,从而有效控制训练成本。如此,本申请能够处理任意多模态数据组合,且具备强泛化能力和零样本任务性能,从而更好地适配行人重识别在现实应用中的多样化场景。
-
公开(公告)号:CN116563629A
公开(公告)日:2023-08-08
申请号:CN202310524660.9
申请日:2023-05-10
Applicant: 武汉大学
IPC: G06V10/764 , G06V10/82 , G06T7/00 , G06V10/80
Abstract: 本发明公开了一种具有可解释性的多视角肺结节图像分类方法、系统及设备,首先基于肺部CT影像生成一个包含目标结节的子正方体空间;对所得到的三个视角切面信息进行块状化处理后对其进行向量化计算,之后输入至基于自注意力机制的深度学习网络中进行特征提取,得到代表该结节视觉的特征;将得到的特征输入至AIM模块中,通过模块内的对应预测头分别得到结节属性分析结果与结节内部结构分析结果,并将结节属性分析模块中的两个线性映射层参数融合至输入的特征中,并输入至良恶性分类模块中,得到分类结果。本发明考虑了肺结节分类方面特征提取方法的不足与模型预测结果可解释性差的问题,弥补了现有方法缺乏有效解决策略的不足。
-
公开(公告)号:CN116487030A
公开(公告)日:2023-07-25
申请号:CN202310400988.X
申请日:2023-04-14
Applicant: 武汉大学
IPC: G16H50/20 , G16H10/60 , G06F18/25 , G06F18/241 , G06N3/045 , G06N3/0464 , G06F18/21 , G06F123/02
Abstract: 本发明公开了一种基于注意力机制的多模态异步时序预测方法及装置,涉及人工智能辅助诊疗技术领域,其中,预测方法包括:获取医疗实践中的多模态数据,并对获取的多模态数据进行预处理;构建非线性的时序注意力矩阵和基于简单注意力机制的异步时序预测模块;基于异步时序预测模块,将时序注意力矩阵以及多模态数据的静态特征和时序特征输入,得到输出的静态特征和时序特征并进行拼接,基于最大池化操作得到预测结果;根据得到的预测结果与多模态数据标签之间的交叉熵损失,对时序注意力矩阵和异步时序数据预测模块进行迭代训练;基于训练完成的异步时序数据预测模块实现多模态异步时序预测。本发明有助于实现疾病的早期筛查与预防。
-
-
-
-
-
-
-
-
-