时序边界检测方法及时序感知器

    公开(公告)号:CN114494314B

    公开(公告)日:2025-05-06

    申请号:CN202111615241.3

    申请日:2021-12-27

    Applicant: 南京大学

    Abstract: 时序边界检测方法及时序感知器,基于变换解码器结构和注意力机制,建立通用的无类别时序动作检测模型,检测模型的编码器中引入少量隐特征查询量,通过交叉注意力机制将输入特征压缩到固定维度,并使用变换解码器对特征进行解码,实现通用无类别时序边界的稀疏检测。本发明通过特征压缩,有效解决了长视频的时序冗余问题,并将二次模型的复杂度降低到线性级别;构建边界查询量和上下文查询量这两种隐特征查询量,以相应处理视频中语义不连贯的边界区域和连贯的上下文区域,充分利用视频的语义结构;提出基于交叉注意力计算的对齐损失函数,使网络快速稳定收敛;使用变换解码器稀疏编码边界位置,避免复杂后处理,提高模型泛化性能。

    时序行为检测方法、装置、设备、介质及程序产品

    公开(公告)号:CN117218572A

    公开(公告)日:2023-12-12

    申请号:CN202310961392.7

    申请日:2023-07-31

    Abstract: 本申请实施例公开了一种时序行为检测方法、装置、设备、介质及程序产品。本申请方法,基于动作查询量,从目标视频帧序列中确定多个关键帧、及多个关键物体,然后通过获取关键物体之间的第一特征相关关系、关键帧之间的第二特征相关关系、及关键帧与所述关键物体之间的第三特征相关关系,更新动作查询量。基于更新后的动作查询量,从目标视频帧序列中重新确定多个目标关键帧,并根据目标关键帧及其在目标视频帧序列中的时序位置,确定目标视频帧序列中目标行为的起始时间、结束时间、及行为类别。本方案中,将空间物体语义引入到行为动作检测,结合空间和时间维度上的语义信息,提升了在面对第一视角场景下时序行为的检测精度。

    视频处理方法、视频检测模型训练方法、装置及介质

    公开(公告)号:CN117274851A

    公开(公告)日:2023-12-22

    申请号:CN202211261919.7

    申请日:2022-10-14

    Abstract: 本发明公开了一种视频处理方法、视频检测模型训练方法、装置及介质,获取初始查询向量信息、多个初始查询点信息和视频特征信息,对根据初始查询点信息得到的视频帧特征信息进行计算得到对应的查询点特征信息,根据各个查询点特征信息对各个初始查询点信息进行更新得到多个目标查询点信息,根据初始查询向量信息和所有查询点特征信息得到目标查询向量信息,根据目标查询向量信息识别时序行为的目标行为类别,根据所有目标查询点信息的视频帧时序确定目标行为类别所对应的起始时间和结束时间。本发明实施例能够提高对视频中时序行为的检测准确性。本发明实施例可应用于例如视频审核、视频剪辑、视频素材提取、视频标注等各种场景的视频处理技术中。

    时序边界检测方法及时序感知器

    公开(公告)号:CN114494314A

    公开(公告)日:2022-05-13

    申请号:CN202111615241.3

    申请日:2021-12-27

    Applicant: 南京大学

    Abstract: 时序边界检测方法及时序感知器,基于变换解码器结构和注意力机制,建立通用的无类别时序动作检测模型,检测模型的编码器中引入少量隐特征查询量,通过交叉注意力机制将输入特征压缩到固定维度,并使用变换解码器对特征进行解码,实现通用无类别时序边界的稀疏检测。本发明通过特征压缩,有效解决了长视频的时序冗余问题,并将二次模型的复杂度降低到线性级别;构建边界查询量和上下文查询量这两种隐特征查询量,以相应处理视频中语义不连贯的边界区域和连贯的上下文区域,充分利用视频的语义结构;提出基于交叉注意力计算的对齐损失函数,使网络快速稳定收敛;使用变换解码器稀疏编码边界位置,避免复杂后处理,提高模型泛化性能。

Patent Agency Ranking