-
公开(公告)号:CN113420669B
公开(公告)日:2022-05-10
申请号:CN202110701808.2
申请日:2021-06-24
Applicant: 武汉工程大学
IPC: G06V30/416 , G06V10/762 , G06V10/25 , G06V10/44 , G06V10/82 , G06K9/62 , G06N3/04 , G06N3/08
Abstract: 本发明提供了基于多尺度训练和级联检测的文档版面分析方法和系统,通过把输入的版面图像随机缩放到某个范围尺度的图像,将此尺度的图像输入训练构建好的网络进行特征的提取和融合,根据版面不同元素的属性,设置相应的分割网络分支进行分割识别,使得每张文本图像上的文本、图片、表格、列表、公式得到正确的划分,完成版面分析,实现了同时检测文档图像中的多种类别对象并区分文档图像的目标的功能。本发明提高了检测模型对物体大小的鲁棒性,降低了输入图像缩放操作对模型的影响;采用特征融合模块使模型能够关注图像每个区域的有效特征,忽略无效特征,提高了模型的辨别能力,能更有效地执行文本区域划分任务,增强了特征表达能力。
-
公开(公告)号:CN113420669A
公开(公告)日:2021-09-21
申请号:CN202110701808.2
申请日:2021-06-24
Applicant: 武汉工程大学
Abstract: 本发明提供了基于多尺度训练和级联检测的文档版面分析方法和系统,通过把输入的版面图像随机缩放到某个范围尺度的图像,将此尺度的图像输入训练构建好的网络进行特征的提取和融合,根据版面不同元素的属性,设置相应的分割网络分支进行分割识别,使得每张文本图像上的文本、图片、表格、列表、公式得到正确的划分,完成版面分析,实现了同时检测文档图像中的多种类别对象并区分文档图像的目标的功能。本发明提高了检测模型对物体大小的鲁棒性,降低了输入图像缩放操作对模型的影响;采用特征融合模块使模型能够关注图像每个区域的有效特征,忽略无效特征,提高了模型的辨别能力,能更有效地执行文本区域划分任务,增强了特征表达能力。
-
公开(公告)号:CN113408546A
公开(公告)日:2021-09-17
申请号:CN202110684435.2
申请日:2021-06-21
Applicant: 武汉工程大学
Abstract: 本发明提供了基于相互全局上下文注意力机制的单样本目标检测方法,通过构建用于提取图像特征的特征提取模块、用于图像的上下文特征的全局上下文特征模块、用于从图像的上下文特征中获取图像的通道级依赖信息的迁移模块、用于融合图像的通道级依赖信息与特征的融合模块、用于生成可能存在目标类别的区域的区域建议模块,以及用于输入支持图像的特征与查询图像感兴趣区域特征、输出两者是否为同一类别的概率的全连接类别无关分类器,实现了提高单样本目标检测方法的精确度的功能。本发明的模型不经过重新训练即可实现对新类别的分类,在单样本的条件下能够获取更好的检测效果。
-
公开(公告)号:CN113591928A
公开(公告)日:2021-11-02
申请号:CN202110756083.7
申请日:2021-07-05
Applicant: 武汉工程大学
Abstract: 本发明提供了基于多视角和卷积注意力模块的车辆重识别方法和系统,通过加入卷积注意力模块,使得模型能够关注车辆的有效特征,忽略无效特征,提高了模型的辨别能力;通过局部模块中的公共面计算使得模型具有更强的视角抗干扰能力,解决了不同视角下的同一车辆难以辨别问题;实现了对外观相似的车辆和不同视角下的同一车辆进行重识别的功能。本发明结合全局特征表示和局部特征表示模块,使模型能学习到更好的特征信息,增强了网络的特征表达能力,更有效地执行车辆重识别任务。
-
公开(公告)号:CN113591928B
公开(公告)日:2024-10-15
申请号:CN202110756083.7
申请日:2021-07-05
Applicant: 武汉工程大学
IPC: G06V20/54 , G06V10/774 , G06V10/80 , G06N3/045 , G06N3/0464 , G06V10/44 , G06V10/771 , G06V10/62
Abstract: 本发明提供了基于多视角和卷积注意力模块的车辆重识别方法和系统,通过加入卷积注意力模块,使得模型能够关注车辆的有效特征,忽略无效特征,提高了模型的辨别能力;通过局部模块中的公共面计算使得模型具有更强的视角抗干扰能力,解决了不同视角下的同一车辆难以辨别问题;实现了对外观相似的车辆和不同视角下的同一车辆进行重识别的功能。本发明结合全局特征表示和局部特征表示模块,使模型能学习到更好的特征信息,增强了网络的特征表达能力,更有效地执行车辆重识别任务。
-
公开(公告)号:CN113408546B
公开(公告)日:2023-03-07
申请号:CN202110684435.2
申请日:2021-06-21
Applicant: 武汉工程大学
IPC: G06V10/44 , G06V10/25 , G06V10/764 , G06V10/80 , G06N3/0464 , G06N3/08
Abstract: 本发明提供了基于相互全局上下文注意力机制的单样本目标检测方法,通过构建用于提取图像特征的特征提取模块、用于图像的上下文特征的全局上下文特征模块、用于从图像的上下文特征中获取图像的通道级依赖信息的迁移模块、用于融合图像的通道级依赖信息与特征的融合模块、用于生成可能存在目标类别的区域的区域建议模块,以及用于输入支持图像的特征与查询图像感兴趣区域特征、输出两者是否为同一类别的概率的全连接类别无关分类器,实现了提高单样本目标检测方法的精确度的功能。本发明的模型不经过重新训练即可实现对新类别的分类,在单样本的条件下能够获取更好的检测效果。
-
-
-
-
-