-
公开(公告)号:CN116824485A
公开(公告)日:2023-09-29
申请号:CN202310626383.2
申请日:2023-05-31
Applicant: 哈尔滨工业大学
IPC: G06V20/52 , G06V10/774 , G06V10/776 , G06V10/82 , G06V10/764 , G06V10/762 , G06V10/74 , G06N3/0464 , G06N3/08
Abstract: 一种基于深度学习的开放场景伪装人员小目标检测方法,属于计算机视觉技术和人工智能技术。本发明为解决现有的目标检测方法存在的检测精度低、特征学习能力不足的问题,综合设计了三个高效的模块。本发明的方法采用了一个以域解耦为核心的多域分离模块,抑制了不同样本之间的域分布差异对模型性能的影响;本发明的方法基于反卷积和空洞卷积而设计了一个多尺度融合模块,以增强现有目标检测器对多尺度,尤其是小尺度伪装目标特征的可区分性及特征表达能力;本发明的方法在检测头部采用了特征分离增强模块,缓解了YOLOv7网络输出端处定位和分类相互干扰的问题,实现了目标检测器对远距离隐藏的伪装人员的智能检测和识别的功能。
-
公开(公告)号:CN116821391A
公开(公告)日:2023-09-29
申请号:CN202310855462.0
申请日:2023-07-13
Applicant: 哈尔滨工业大学
IPC: G06F16/532 , G06F16/583 , G06F16/332 , G06F16/33 , G06F16/383 , G06F18/22 , G06F18/25 , G06V10/42 , G06V10/44 , G06V10/82 , G06F40/284 , G06N3/045 , G06N3/0442 , G06N3/0464 , G06N3/047 , G06N3/048
Abstract: 一种基于多级别语义对齐的跨模态图文检索方法,属于跨模态检索和人工智能技术领域。本发明方法提出了一种简单而对称的网络架构来对图像和文本特征进行编码,兼顾了全局‑全局、全局‑局部以及局部‑局部的多级别语义对齐,通过引入模态间细粒度特征交互注意力网络与模态内不同粒度特征融合网络,实现了不同粒度特征在不同级别上的融合交互,解决了现有跨模态检索研究工作存在的多粒度特征交互弱,且难以分辨图像区域特征相似或文本语义相近的图文对的技术问题;同时,本发明方法采用了多级别语义匹配总分数与具有自适应边距值的三元排序损失,实现了更优良的跨模态语义对齐,大大提高了跨模态图文检索任务的精度。
-
公开(公告)号:CN116824330A
公开(公告)日:2023-09-29
申请号:CN202310626378.1
申请日:2023-05-31
Applicant: 哈尔滨工业大学
IPC: G06V10/82 , G06V10/40 , G06V10/764 , G06V10/774 , G06V10/776 , G06V10/25 , G06N3/0464 , G06N3/0455 , G06N3/047 , G06N3/048 , G06N3/08
Abstract: 一种基于深度学习的小样本跨域目标检测方法,属于计算机视觉技术和人工智能技术。本发明为解决现有方法因场景变换、目标形态变化等导致的特征提取能力下降的问题,综合设计了四个高效的模块。本发明的方法设计了一个多层次关键特征生成器,使模型能够从大量源域数据中获得不同层次的先验知识;设计了一个嵌入式空间隐式关联策略,为成功区分目标提供信息支持;本发明采用了一个实例嵌入策略,来提高模型对样本数量稀少的新类目标的弱分类能力;重新设计具有自适应加权的损失函数,消除以往方法根据经验确定多个损失函数系数的弊端。本发明可以通过寻找不同场景同类目标之间的共性,克服跨域造成的背景干扰。本发明可用于小样本跨域目标检测。
-
-