-
公开(公告)号:CN120071114A
公开(公告)日:2025-05-30
申请号:CN202510297865.7
申请日:2025-03-13
Applicant: 大连海事大学
IPC: G06V20/05 , G06V10/25 , G06V10/82 , G06V10/40 , G06V10/44 , G06V10/80 , G06V10/764 , G06V10/766 , G06N3/045 , G06N3/0464
Abstract: 本发明提供了一种基于状态空间模型的水下目标检测方法。本发明主要采用一种状态空间模型的思想,通过对水下图像构建全局退化建模与局部物理增强的并行通路,对水下图像存在的若干退化因素进行准确提取。针对现有目标检测受限于局部感受野,对多种类型的图像退化难以建模长程退化依赖,本发明提出了利用状态空间模型对上下文信息的感知能力建模退化问题,最后基于真实场景水下数据集进行训练、推理,获取准确的水下目标定位信息。
-
公开(公告)号:CN119785423A
公开(公告)日:2025-04-08
申请号:CN202411811915.0
申请日:2024-12-10
Applicant: 大连海事大学
IPC: G06V40/20 , G06V10/764 , G06V10/774 , G06V10/82 , G06V10/80 , G06N3/042 , G06N3/0464 , G06N3/045 , G06N3/08
Abstract: 本发明提供一种基于自适应结构优化的资源灵活性骨架动作分类方法,包括:采集待训练的骨架视频样本,并进行预处理,构建合格数据集;将合格数据集作为基础输入IC‑GC空间域模型,得到每个关节的独特特征和不同关节间的交互信息;将IC‑GC空间域模型的输出作为IC‑TC时间域模型的输入,得到通用特征和突出特征;引入Skip‑Trans跳转链接机制,实现模型不同层级间的信息传递,保留深层迭代过程中的关键信息;针对不同硬件环境和效率需求,设计IC‑GCN‑Plus和IC‑GCN‑Light两种模型变体,实现骨架动作分类。
-
公开(公告)号:CN119785422A
公开(公告)日:2025-04-08
申请号:CN202411811914.6
申请日:2024-12-10
Applicant: 大连海事大学
IPC: G06V40/20 , G06V10/74 , G06V10/764 , G06V10/80 , G06V10/82 , G06N3/042 , G06N3/0464 , G06N3/045 , G06N3/084 , G06N3/088
Abstract: 本发明提供一种基于多模态关键语义的无监督骨架行为识别方法及系统,本发明方法包括:采集预训练的多模态骨架视频序列,进行预处理,构建骨架数据集;利用多模态大语言模型对骨架数据集中的每一类动作图像进行时序理解,并生成关键描述,通过语义编码器生成文本描述特征簇;通过混合增强策略和时空图卷积ST‑GCN模型捕捉骨架数据集中图片的骨架动作特征簇;利用GLIP语义对齐策略,将文本描述特征簇和骨架动作特征簇映射至同一个表征空间,将不同动作进行相似性比较,利用反向传播训练骨架编码器,实现骨架行为识别。
-
公开(公告)号:CN120071384A
公开(公告)日:2025-05-30
申请号:CN202411905192.0
申请日:2024-12-23
Applicant: 大连海事大学
IPC: G06V40/10 , G06V20/52 , G06V10/42 , G06V10/44 , G06V10/52 , G06V10/74 , G06V10/774 , G06V10/82 , G06N3/045 , G06N3/0464 , G06N3/084
Abstract: 本发明公开了一种基于跨尺度信息交互的跨模态行人重识别方法,属于计算机视觉技术领域,主要包括:把可见光行人图像和红外行人图像送入跨模态混淆器,运用成熟的图像处理技术,对这两种不同模态的输入图像进行预处理,进而得到符合模型要求的输入对象;随后,采用参数分离的特征提取网络,对输入对象进行处理分别获取可见光图像特征和红外图像特征;在此基础上,利用参数共享的特征提取网络,并结合跨尺度交互模块,进一步提取出模态共享特征;同时,针对特征提取网络所输出的两种不同尺度的特征,分别从中提取全局特征以及局部区域特征信息;最后,依据所获取的特征采用多损失联合优化策略,优化模型,最后基于查询图像和图库图像特征之间的相似度来确定查询结果。本发明能够显著提高可见光红外行人重识别的准确性与效率,在安防监控等诸多需要行人身份识别的领域有着广阔的应用前景。
-
-
-