-
公开(公告)号:CN113361432B
公开(公告)日:2022-03-15
申请号:CN202110662868.8
申请日:2021-06-15
Applicant: 电子科技大学
IPC: G06V20/40 , G06V20/62 , G06V10/774 , G06V10/764 , G06V10/82 , G06K9/62 , G06N3/04 , G06N3/08
Abstract: 本发明公开了一种基于深度学习的视频文字端到端检测与识别的方法,属于视频文字处理技术领域。本发明的步骤包括:对待识别的视频序列段,分别对每一视频帧图像进行图像尺寸归一化处理,以使得预处理后的图像尺寸与端到端的文字检测与识别网络的输入相匹配;将预处理后的图像依次输入至端到端的文字检测与识别网络,获取待识别的视频序列段的文字识别结果。本发明实现了视频文字端到端的检测与识别,规避了多模块目标不一致而导致误差累积等固有缺陷,减少了工程复杂度。还通过共享特征提取网络优化网络结构,同时由于使用了感受野较大的特征图输入到网络的识别分支中,相比于使用原图进行输入,特征图能够包含更大范围的信息,提高了识别准确率。
-
公开(公告)号:CN115482381A
公开(公告)日:2022-12-16
申请号:CN202211131496.7
申请日:2022-09-15
Applicant: 电子科技大学
Abstract: 本发明公开了一种基于深度学习的小尺度目标部件分割方法,属于图像目标检测和分割技术领域。本发明首先构建小尺度目标数据集,包含分割数据集、超分辨重建数据集以及目标检测数据集三部分;针对小尺度目标部位分割任务,设置对应的小尺度目标部件分割网络模型,并以分割数据集为基础对模型进行训练进而获取到最优模型;结合超分辨重建以及目标检测相关技术设置的小尺度目标增强方法,在不影响普通目标分割效果基础上,有针对的提高了分割算法对小尺度目标的分割精度。
-
公开(公告)号:CN115482380B
公开(公告)日:2025-02-07
申请号:CN202211121092.X
申请日:2022-09-15
Applicant: 电子科技大学
IPC: G06V10/26 , G06V10/20 , G06T17/00 , G06T17/20 , G06V10/764 , G06V10/82 , G06V20/56 , G06V20/64 , G06V20/70
Abstract: 本发明公开了一种基于深度学习的多等级公路三维点云目标分割方法,属于三维点云目标分割技术领域。本发明首先通过基于Map数据结构和K‑D树的点云数据预处理操作构建预处理后的点与原始点云的映射关系,并基于所所设置的多等级公路点云目标分割网络对数据预处理后的数据进行目标分割处理,再基于该映射关系还原为原始点云目标分割结果。本发明的数据预处理操作显著降低了计算量,本发明的目标分割网络利用特征聚合模块和注意力机制池化保留了点云数据的几何特征,且增强了点的特征向量,利于随机采样层提取全局特征。建立残差网络避免了梯度消失,并且扩大了每个点的感受野,利于随机采样层提取点云的局部几何特征,大大提高了点云目标分割的准确率。
-
公开(公告)号:CN113705338B
公开(公告)日:2023-04-07
申请号:CN202110802288.4
申请日:2021-07-15
Applicant: 电子科技大学
Abstract: 本发明公开了一种改进的离线手写汉字识别方法,属于图像识别技术领域。在本发明,由于手写汉字的书写自由度较大,单个汉字中部件与部件之间的组合随意,字形变形程度强。本发明构建的神经网络结构,极大降低了网络计算量,特征通道重排的引入,消除了图像特征通道信息不交流问题,而残差结构的引入,综合不同卷积层对汉字图形特征的表达能力和侧重。在轻量化模型的前提下,增强了通道维度信息间的交流与融合,同时也增强不同层次的特征间的交流与融合,提升了网络模型对离线手写汉字特征复用的能力,提高了模型对离线手写汉字的识别精度。
-
公开(公告)号:CN115482380A
公开(公告)日:2022-12-16
申请号:CN202211121092.X
申请日:2022-09-15
Applicant: 电子科技大学
IPC: G06V10/26 , G06V10/20 , G06T17/00 , G06T17/20 , G06V10/764 , G06V10/82 , G06V20/56 , G06V20/64 , G06V20/70
Abstract: 本发明公开了一种基于深度学习的多等级公路三维点云目标分割方法,属于三维点云目标分割技术领域。本发明首先通过基于Map数据结构和K‑D树的点云数据预处理操作构建预处理后的点与原始点云的映射关系,并基于所所设置的多等级公路点云目标分割网络对数据预处理后的数据进行目标分割处理,再基于该映射关系还原为原始点云目标分割结果。本发明的数据预处理操作显著降低了计算量,本发明的目标分割网络利用特征聚合模块和注意力机制池化保留了点云数据的几何特征,且增强了点的特征向量,利于随机采样层提取全局特征。建立残差网络避免了梯度消失,并且扩大了每个点的感受野,利于随机采样层提取点云的局部几何特征,大大提高了点云目标分割的准确率。
-
公开(公告)号:CN115482256A
公开(公告)日:2022-12-16
申请号:CN202211120996.0
申请日:2022-09-15
Applicant: 电子科技大学
Abstract: 本发明公开了一种轻量化的目标检测与基于语义分割的自动跟踪方法,属于目标检测和目标跟踪技术领域。本发明首先设置了一种轻量化的目标检测网络,用于获取图像中待检测目标的坐标信息和类别结果,为后续跟踪步骤中对新目标的进入和旧目标消失的辨别做准备;进而在语义分割的目标跟踪算法的基础之上,实现对目标的自动初始化以及目标从边界进入和消失的识别;本发明可以应用于公共安全、边防巡检、农业植保、救灾救火等垂直应用领域,提升对指定目标的检测与跟踪性能。
-
公开(公告)号:CN115497027B
公开(公告)日:2025-04-04
申请号:CN202211219375.8
申请日:2022-09-30
Applicant: 电子科技大学
IPC: G06V20/70 , G06V20/40 , G06V10/26 , G06V10/28 , G06V10/42 , G06V10/44 , G06V10/62 , G06V10/774 , G06V10/80 , G06V10/82 , G06N3/045 , G06N3/0464 , G06N3/084
Abstract: 本发明公开了一种基于深度学习的无人机关键部件实时视频语义分割方法,属于图像的语义分割技术领域。本发明通过收集网络上所有出现无人机的场景,并对连续多帧进行拆分,标注关键帧后进行数据增强,得到无人机视频语义分割数据集,使用多分支特征提取网络,对视频帧进行特征学习,将多分支特征融合补充,达到深层网络特征提取效果,以达到相同精度下提升网络速度的效果;使用光流信息将分割阶段的低级特征对称融合到后续卷积阶段,保证边缘细节不在卷积网络中丢失,保证了边缘分割到精度,为后续利用边缘信息的中心点计算提供保证。本发明根据视频语义分割识别结果,基于像素替换和二值化处理等获取目标部件轮廓及中心点,提升了易用性。
-
公开(公告)号:CN115482381B
公开(公告)日:2025-02-14
申请号:CN202211131496.7
申请日:2022-09-15
Applicant: 电子科技大学
IPC: G06V10/26 , G06V10/82 , G06T3/4046 , G06T3/4053 , G06N3/084 , G06N3/0455 , G06N3/0464
Abstract: 本发明公开了一种基于深度学习的小尺度目标部件分割方法,属于图像目标检测和分割技术领域。本发明首先构建小尺度目标数据集,包含分割数据集、超分辨重建数据集以及目标检测数据集三部分;针对小尺度目标部位分割任务,设置对应的小尺度目标部件分割网络模型,并以分割数据集为基础对模型进行训练进而获取到最优模型;结合超分辨重建以及目标检测相关技术设置的小尺度目标增强方法,在不影响普通目标分割效果基础上,有针对的提高了分割算法对小尺度目标的分割精度。
-
公开(公告)号:CN115497027A
公开(公告)日:2022-12-20
申请号:CN202211219375.8
申请日:2022-09-30
Applicant: 电子科技大学
IPC: G06V20/40 , G06V20/70 , G06V10/26 , G06V10/28 , G06V10/42 , G06V10/44 , G06V10/62 , G06V10/774 , G06V10/80 , G06V10/82 , G06N3/04 , G06N3/08
Abstract: 本发明公开了一种基于深度学习的无人机关键部件实时视频语义分割方法,属于图像的语义分割技术领域。本发明通过收集网络上所有出现无人机的场景,并对连续多帧进行拆分,标注关键帧后进行数据增强,得到无人机视频语义分割数据集,使用多分支特征提取网络,对视频帧进行特征学习,将多分支特征融合补充,达到深层网络特征提取效果,以达到相同精度下提升网络速度的效果;使用光流信息将分割阶段的低级特征对称融合到后续卷积阶段,保证边缘细节不在卷积网络中丢失,保证了边缘分割到精度,为后续利用边缘信息的中心点计算提供保证。本发明根据视频语义分割识别结果,基于像素替换和二值化处理等获取目标部件轮廓及中心点,提升了易用性。
-
公开(公告)号:CN113705338A
公开(公告)日:2021-11-26
申请号:CN202110802288.4
申请日:2021-07-15
Applicant: 电子科技大学
Abstract: 本发明公开了一种改进的离线手写汉字识别方法,属于图像识别技术领域。在本发明,由于手写汉字的书写自由度较大,单个汉字中部件与部件之间的组合随意,字形变形程度强。本发明构建的神经网络结构,极大降低了网络计算量,特征通道重排的引入,消除了图像特征通道信息不交流问题,而残差结构的引入,综合不同卷积层对汉字图形特征的表达能力和侧重。在轻量化模型的前提下,增强了通道维度信息间的交流与融合,同时也增强不同层次的特征间的交流与融合,提升了网络模型对离线手写汉字特征复用的能力,提高了模型对离线手写汉字的识别精度。
-
-
-
-
-
-
-
-
-