-
公开(公告)号:CN119992429A
公开(公告)日:2025-05-13
申请号:CN202510471124.6
申请日:2025-04-15
Applicant: 杭州电子科技大学信息工程学院
IPC: G06V20/40 , G06V40/20 , G06V10/82 , G06V10/44 , G06V10/776 , G06V10/80 , G06V10/62 , G06V10/774 , G06N3/045 , G06N3/0464
Abstract: 本发明公开了一种基于双阶段神经网络的点监督时序动作定位方法及系统。该方法包括:首先针对点监督标注的时序动作定位数据集,通过I3D视频特征提取网络提取每个动作视频的视频特征;然后对候选提案生成模块进行第一阶段的帧级原型学习,以及对边界定位模块进行第二阶段的实例级边界学习;最后,针对目标动作视频,将其通过I3D视频特征提取网络提取视频特征后输入经过学习的候选提案生成模块,生成所有候选提案后输入经过学习的边界定位模块,对得到的所有修正后提案计算提案分数并执行soft‑NMS算法,获得最终提案。本发明可有效区分视频中的背景和动作,同时提取视频全局的动作特征。以实现人体时序动作定位,提高定位精确度。