-
公开(公告)号:CN118212502A
公开(公告)日:2024-06-18
申请号:CN202410412263.7
申请日:2024-04-08
Applicant: 哈尔滨工业大学(威海) , 长江时代通信股份有限公司
IPC: G06V10/82 , G06V10/774 , G06V10/40 , G06V10/80 , G06V10/26 , G06V10/22 , G06V10/764 , G06V20/70 , G06N3/0455 , G06N3/096 , G06N3/0464 , G06N3/048
Abstract: 本发明公开了一种基于图像焦点区域特征的多任务学习方法,方法步骤包括:收集原始图像获得输入图像;进行基础特征提取获得基础特征图像;利用分支结构生成视觉解释图;进行焦点区域的特征融合获得特征融合图像;利用单解码器进行特征压缩以及分割结果预测获得掩膜图;利用掩膜图进行区域选取获得掩膜特征图;将基础特征图像、视觉解释图和掩膜特征图进行叠加累乘生成预测结果。该多任务学习方法通过焦点区域的视觉解释图和掩膜图相结合的方式实现图像分类、分割及定位任务的多任务联合学习,解决了现阶段多任务学习领域中分类、分割、定位任务间出现负迁移的问题,实现多任务在语义层面的一致性,提高图像分类、分割及定位任务的效果。
-
公开(公告)号:CN118212502B
公开(公告)日:2025-03-25
申请号:CN202410412263.7
申请日:2024-04-08
Applicant: 哈尔滨工业大学(威海) , 长江时代通信股份有限公司
IPC: G06V10/82 , G06V10/774 , G06V10/40 , G06V10/80 , G06V10/26 , G06V10/22 , G06V10/764 , G06V20/70 , G06N3/0455 , G06N3/096 , G06N3/0464 , G06N3/048
Abstract: 本发明公开了一种基于图像焦点区域特征的多任务学习方法,方法步骤包括:收集原始图像获得输入图像;进行基础特征提取获得基础特征图像;利用分支结构生成视觉解释图;进行焦点区域的特征融合获得特征融合图像;利用单解码器进行特征压缩以及分割结果预测获得掩膜图;利用掩膜图进行区域选取获得掩膜特征图;将基础特征图像、视觉解释图和掩膜特征图进行叠加累乘生成预测结果。该多任务学习方法通过焦点区域的视觉解释图和掩膜图相结合的方式实现图像分类、分割及定位任务的多任务联合学习,解决了现阶段多任务学习领域中分类、分割、定位任务间出现负迁移的问题,实现多任务在语义层面的一致性,提高图像分类、分割及定位任务的效果。
-
公开(公告)号:CN119068306B
公开(公告)日:2025-04-29
申请号:CN202411087561.X
申请日:2024-08-09
Applicant: 哈尔滨工业大学(威海) , 南京龙垣信息科技有限公司
IPC: G06V10/82 , G06V10/764 , G06V10/74 , G06V10/44 , G06V10/80 , G06N3/0464 , G06N3/0455 , G06N3/084 , G06N3/09 , G06N3/096 , G06N5/04
Abstract: 本发明涉及数据处理技术领域,具体涉及一种基于多视图知识蒸馏的图像识别方法,包括:通过成像设备获取单一目标在不同视角下的多个成像视图;教师网络对多个视图分别进行卷积辅助分支和注意力辅助分支的并行特征提取;将两个分支生成的辅助特征并行输入多视图对位加权模块进行多视图对应位置间的特征融合;利用融合后的特征向量预测目标在单视角和多视角下的类别概率并使用真实标签进行监督;学生模型对多个视图分别进行原型特征提取;利用师生训练框架对学生网络在真实标签和教师预测标签的监督下进行训练,得到轻量化多视图模型;解决了现阶段多视图识别模型参数量大、训练和推理成本较高、推理速度慢的问题。
-
公开(公告)号:CN119068306A
公开(公告)日:2024-12-03
申请号:CN202411087561.X
申请日:2024-08-09
Applicant: 哈尔滨工业大学(威海) , 南京龙垣信息科技有限公司
IPC: G06V10/82 , G06V10/764 , G06V10/74 , G06V10/44 , G06V10/80 , G06N3/0464 , G06N3/0455 , G06N3/084 , G06N3/09 , G06N3/096 , G06N5/04
Abstract: 本发明涉及数据处理技术领域,具体涉及一种基于多视图知识蒸馏的图像识别方法,包括:通过成像设备获取单一目标在不同视角下的多个成像视图;教师网络对多个视图分别进行卷积辅助分支和注意力辅助分支的并行特征提取;将两个分支生成的辅助特征并行输入多视图对位加权模块进行多视图对应位置间的特征融合;利用融合后的特征向量预测目标在单视角和多视角下的类别概率并使用真实标签进行监督;学生模型对多个视图分别进行原型特征提取;利用师生训练框架对学生网络在真实标签和教师预测标签的监督下进行训练,得到轻量化多视图模型;解决了现阶段多视图识别模型参数量大、训练和推理成本较高、推理速度慢的问题。
-
-
-