-
公开(公告)号:CN112446372B
公开(公告)日:2022-11-08
申请号:CN202011442288.X
申请日:2020-12-08
Applicant: 电子科技大学
Abstract: 本发明提供一种基于通道分组注意力机制的文本检测方法,针对不同尺度的目标在特征谱上采用不同尺度的预置框,而融合前的具有较多空间信息的较高分辨率预测特征谱不能很好表示文本特征,直接输入到检测头效果较差。申请人经过实验后发现在八分之一分辨率的预测特征谱上引入注意力模块,提升了八分之一尺度下TextBoxes_plusplus算法的文本偏移预测与候选框回归效果,从而适应文本多变的长宽比减少漏检误检,很好地增强特征鲁棒性,保留空间信息提高小目标文本检测精度。另外本发明注意力机制在编码与解码上分别使用卷积和分组卷积替代全连接,降低了参数量与计算复杂度,对比普通通道注意力,在性能近似情况下高效实现注意力机制。
-
公开(公告)号:CN112446372A
公开(公告)日:2021-03-05
申请号:CN202011442288.X
申请日:2020-12-08
Applicant: 电子科技大学
Abstract: 本发明提供一种基于通道分组注意力机制的文本检测方法,针对不同尺度的目标在特征谱上采用不同尺度的预置框,而融合前的具有较多空间信息的较高分辨率预测特征谱不能很好表示文本特征,直接输入到检测头效果较差。申请人经过实验后发现在四分之一分辨率的预测特征谱上引入注意力模块,提升了四分之一尺度下TextBoxes_plusplus算法的文本偏移预测与候选框回归效果,从而适应文本多变的长宽比减少漏检误检,很好地增强特征鲁棒性,保留空间信息提高小目标文本检测精度。另外本发明注意力机制在编码与解码上分别使用卷积和分组卷积替代全连接,降低了参数量与计算复杂度,对比普通通道注意力,在性能近似情况下高效实现注意力机制。
-
公开(公告)号:CN112446348A
公开(公告)日:2021-03-05
申请号:CN202011443338.6
申请日:2020-12-08
Applicant: 电子科技大学
Abstract: 本发明针对目前双流网络由于时序分支中光流计算开销的限制,训练时间过长的问题,以及,由于多光源、阴影、遮挡等原因,计算出来的光流场并不一定是可靠;时空域特征建模完全分离,在网络最后的融合可能不充分的问题,提供一种基于特征谱流的行为识别方法,使用特征谱流替代光流作为时间3D卷积网络的输入。对行为视频流进行1x1卷积生成每帧的特征谱,再依次对各帧的特征谱进行3x3卷积,依次将相邻两帧中前一帧特征谱3x3卷积结果与后一帧特征谱在像素维度上相减,根据相减结果生成特征谱流中的一个谱。特征谱流具有更强的鲁棒性,使得本发明在显著减小存储和计算开销的情况下取得更佳的识别效果。
-
公开(公告)号:CN112446348B
公开(公告)日:2022-05-31
申请号:CN202011443338.6
申请日:2020-12-08
Applicant: 电子科技大学
Abstract: 本发明针对目前双流网络由于时序分支中光流计算开销的限制,训练时间过长的问题,以及,由于多光源、阴影、遮挡等原因,计算出来的光流场并不一定是可靠;时空域特征建模完全分离,在网络最后的融合可能不充分的问题,提供一种基于特征谱流的行为识别方法,使用特征谱流替代光流作为时间3D卷积网络的输入。对行为视频流进行1x1卷积生成每帧的特征谱,再依次对各帧的特征谱进行3x3卷积,依次将相邻两帧中前一帧特征谱3x3卷积结果与后一帧特征谱在像素维度上相减,根据相减结果生成特征谱流中的一个谱。特征谱流具有更强的鲁棒性,使得本发明在显著减小存储和计算开销的情况下取得更佳的识别效果。
-
公开(公告)号:CN112685590A
公开(公告)日:2021-04-20
申请号:CN202011597827.7
申请日:2020-12-29
Applicant: 电子科技大学
IPC: G06F16/583 , G06F16/538 , G06N3/04
Abstract: 本发明提出一种基于卷积神经网络正则化处理的图像检索方法,利用基于结构拓展的卷积神经网络正则化处理,将神经网络结构用有向无环图的形式来表示,再对有向无环图的结构进行一系列拓展,然后训练拓展后所得图所对应的神经网络,最后将神经网络中除原始结构以外的层删除。相比现有技术,本发明所提方法在不增加推理代价的情况下,提升了神经网络的性能,在计算机视觉的各大方向均有应用前景。
-
公开(公告)号:CN112685590B
公开(公告)日:2022-10-14
申请号:CN202011597827.7
申请日:2020-12-29
Applicant: 电子科技大学
IPC: G06F16/583 , G06F16/538 , G06N3/04
Abstract: 本发明提出一种基于卷积神经网络正则化处理的图像检索方法,利用基于结构拓展的卷积神经网络正则化处理,将神经网络结构用有向无环图的形式来表示,再对有向无环图的结构进行一系列拓展,然后训练拓展后所得图所对应的神经网络,最后将神经网络中除原始结构以外的层删除。相比现有技术,本发明所提方法在不增加推理代价的情况下,提升了神经网络的性能,在计算机视觉的各大方向均有应用前景。
-
-
-
-
-