-
公开(公告)号:CN111898421B
公开(公告)日:2022-11-11
申请号:CN202010560716.2
申请日:2020-06-18
Applicant: 东南大学
Abstract: 本发明公开了一种用于视频行为识别的正则化方法,首先利用全局平均池化技术对每个时间步上的特征图进行显著性评估,利用gESD检验方法确定包含最显著空间特征的特征图,然后在选定的特征图内以通道为最小单元,以通道激活值占比为依据来计算每个通道的丢弃概率并执行丢弃操作(对应通道激活值置零),最后,由于正则化模块只在训练阶段生效,为保持训练阶段与推理阶段输出激活值幅度的一致性,需要为训练阶段的输出计算一个补偿系数与输出特征图相乘。本发明可以在推理阶段不增加任何额外计算消耗的情况下有效提高视频识别网络的验证集精度,且可以加入任何现有神经网络架构中,有效缓解网络在视频识别任务中过拟合空间特征而忽视时序特征的问题。
-
公开(公告)号:CN111860222A
公开(公告)日:2020-10-30
申请号:CN202010620022.3
申请日:2020-06-30
Applicant: 东南大学
Abstract: 本发明公开了一种基于稠密-分段式帧采样的视频行为识别方法、系统、计算机设备和存储介质。首先将视频均匀地分为N段,在每段中采样一帧做为关键帧,由关键帧组成关键片段。同时,对每一个关键帧,在其前后按固定的采样率采样连续若干帧,作为上下文帧。将上下文帧和其对应的关键帧组成一个上下文片段。进行一次稠密-分段式帧采样,将会返回一个关键片段和N个上下文片段,将其送入时序稠密-分段式网络TDSN中进行处理,从关键片段中提取长程时序信息,从上下文片段中提取局部上下文信息,将两种信息融合在一起,最终用于识别视频中的行为动作。本发明能够有效提取视频中的长程时序信息和局部上下文信息,有效地提升了视频行为识别的准确率。
-
公开(公告)号:CN111860222B
公开(公告)日:2022-11-18
申请号:CN202010620022.3
申请日:2020-06-30
Applicant: 东南大学
Abstract: 本发明公开了一种基于稠密‑分段式帧采样的视频行为识别方法、系统、计算机设备和存储介质。首先将视频均匀地分为N段,在每段中采样一帧做为关键帧,由关键帧组成关键片段。同时,对每一个关键帧,在其前后按固定的采样率采样连续若干帧,作为上下文帧。将上下文帧和其对应的关键帧组成一个上下文片段。进行一次稠密‑分段式帧采样,将会返回一个关键片段和N个上下文片段,将其送入时序稠密‑分段式网络TDSN中进行处理,从关键片段中提取长程时序信息,从上下文片段中提取局部上下文信息,将两种信息融合在一起,最终用于识别视频中的行为动作。本发明能够有效提取视频中的长程时序信息和局部上下文信息,有效地提升了视频行为识别的准确率。
-
公开(公告)号:CN111898421A
公开(公告)日:2020-11-06
申请号:CN202010560716.2
申请日:2020-06-18
Applicant: 东南大学
Abstract: 本发明公开了一种用于视频行为识别的正则化方法,首先利用全局平均池化技术对每个时间步上的特征图进行显著性评估,利用gESD检验方法确定包含最显著空间特征的特征图,然后在选定的特征图内以通道为最小单元,以通道激活值占比为依据来计算每个通道的丢弃概率并执行丢弃操作(对应通道激活值置零),最后,由于正则化模块只在训练阶段生效,为保持训练阶段与推理阶段输出激活值幅度的一致性,需要为训练阶段的输出计算一个补偿系数与输出特征图相乘。本发明可以在推理阶段不增加任何额外计算消耗的情况下有效提高视频识别网络的验证集精度,且可以加入任何现有神经网络架构中,有效缓解网络在视频识别任务中过拟合空间特征而忽视时序特征的问题。
-
-
-