-
公开(公告)号:CN119559699A
公开(公告)日:2025-03-04
申请号:CN202411668213.1
申请日:2024-11-20
Applicant: 中国科学院自动化研究所 , 北京市公安局
Abstract: 本公开涉及人体行为识别方法及装置。所述人体行为识别方法包括:基于人体骨架序列确定关节差异拓扑表示和关节依赖拓扑表示,并且基于关节差异拓扑表示和关节依赖拓扑表示,确定图拓扑特征,其中,人体骨架序列被表示为图结构,图拓扑特征为通用结构拓扑表示、关节差异拓扑表示和关节依赖拓扑表示之和;基于人体骨架序列和图拓扑特征,确定人体骨架序列的动作特征;利用细粒度原型对图拓扑特征进行重建,以获得精细化的动作拓扑表示;基于人体骨架序列的动作特征以及精细化的动作拓扑表示,利用原型对比损失函数和交叉熵损失函数确定人体骨架序列的动作类别。通过采用本公开,能够更好地捕捉动作的细微差别变化,有效提取具有辨别力的行为特征。
-
公开(公告)号:CN119172500A
公开(公告)日:2024-12-20
申请号:CN202411122028.2
申请日:2024-08-15
Applicant: 天津中科智能识别有限公司 , 北京市公安局
IPC: H04N7/18 , H04N21/43 , G10L21/0208 , G10L25/30
Abstract: 本发明公开一种基于跨模态注意力机制的监控音视频联合优化方法,包括:对监控获得的音频文件中的音频进行降噪;构建监控获得的视频文件中用户特征和降噪后音频文件中的语音特征的特征映射关系;通过所述特征映射关系进行降噪后音频的特征识别标识,获得标识结果;基于所述标识结果与偏离验证时间区间进行音视频的同步匹配,获得同步匹配结果;根据校正需求信息确定视频的特征帧数量,根据所述特征帧数量和所述同步匹配结果生成校正特征帧,根据所述校正特征帧进行音视频的同步调整。本发明解决了传统监控系统中在户外场景中音视频不同步,现场音质不清晰等问题。
-