-
公开(公告)号:CN119446187A
公开(公告)日:2025-02-14
申请号:CN202411574793.8
申请日:2024-11-06
Applicant: 重庆邮电大学
Abstract: 本发明涉及一种深度学习辅助的枪声检测与定位方法,属于声音定位技术领域,包括枪声检测阶段和声源到达方向(DOA)估计阶段;在枪声检测阶段利用卷积神经网络(CNN)对捕获的声音信号进行分类,对于属于枪声的声音信号,再进入DOA估计阶段,利用CNN定位枪声的声源到达方向;本发明将接收信号的多声道语谱图作为输入特征,具有灵活、成本低的特点,可以从更长期的角度获取接收到的声音信号的更多信息,也更好地利用基于CNN的深度学习网络,而且只需要很小尺寸的双麦克风即可满足DOA估计的输入要求。
-
公开(公告)号:CN119445489A
公开(公告)日:2025-02-14
申请号:CN202411574792.3
申请日:2024-11-06
Applicant: 重庆邮电大学
IPC: G06V20/52 , G06V40/20 , G06V10/25 , G06T7/246 , G06V10/44 , G06V10/764 , G06V10/82 , G06N3/0464 , G06F21/60 , G06F21/62
Abstract: 本发明涉及一种低成本步态识别与可疑行为检测方法,属于图像处理领域。该方法利用现有的监控摄像头和深度学习算法实现对行人行为的自动识别和告警。具体步骤包括:利用摄像头实时捕捉监控区域内的行人目标,对目标进行动态跟踪,并将锚框中的行人图像连续截取并保存;对保存的图像进行边缘检测处理,提取图像的主要轮廓信息;选取相邻的连续N幅图像进行堆叠,形成三维张量;将堆叠后的图像输入到预训练的基于卷积神经网络的分类系统中,分析图像序列中的行为特征,并判断目标行为是否符合可疑行为标准,并进一步确定具体的行为类别。本发明具有成本低、精度高、实时性强等优点。
-