基于Deepsort的密集对象多目标跟踪方法

    公开(公告)号:CN117058193A

    公开(公告)日:2023-11-14

    申请号:CN202310995158.6

    申请日:2023-08-09

    Abstract: 本发明公开了基于Deepsort的密集对象多目标跟踪方法,将摄像头采集到的视频帧作为模型输入;采用yolov7目标检测模型提取视频帧中目标物体的外观特征,将输入图片划分为多个大小相同的网格,同时预测当前物体的边界框和类别。保留满足指定阈值的预测边界框,并对检测产生的预测边界框进行非最大值抑制计算,去除冗余边界框后,输出目标边界框,标注目标类型和置信度分数;将检测得到的物体坐标信息和物体类别信息输入到Deepsort多目标跟踪模型中,Deepsort通过卡尔曼滤波来预测下一帧跟踪物体的坐标,使用余弦距离对比物体的外观特征,进行目标间的相似度比较,使用匈牙利算法将当前帧的检测结果与上一帧的跟踪结果进行匹配。本发明能够满足高帧率相机下实时跟踪的目标。

    一种回声音频生成系统及方法
    43.
    发明公开

    公开(公告)号:CN116386587A

    公开(公告)日:2023-07-04

    申请号:CN202310223774.X

    申请日:2023-03-09

    Abstract: 本发明公开了一种回声音频生成系统及方法,涉及语音信号处理技术领域。包括依次连接的音频输入模块、音频处理模块和音频输出模块;音频输入模块用于对原始音频进行预处理操作,输出预处理音频,并将其发送至音频处理模块;音频处理模块用于选择预处理音频的回声路径,生成回声音频并将其发送至音频输出模块;音频输出模块接收回声音频并对其进行后处理操作。本发明通过线性增益和延时处理生成线性回声,通过加噪处理生成线性带噪回声;通过多路径的设定生成多路线性回声;通过上述可控的参数设定,采集到指定的多种类型的回声。本发明无需通过硬件设备采集回声音频,节省了大量的人力物力资源;耗时短,可以满足短期内大量生成回声的需求。

    一种基于视觉概念图表示的人-模型交互解释引导方法、电子设备和存储介质

    公开(公告)号:CN115797498A

    公开(公告)日:2023-03-14

    申请号:CN202211483418.3

    申请日:2022-11-24

    Abstract: 本发明公开了一种基于视觉概念图表示的人‑模型交互解释引导方法、电子设备和存储介质,所述方法包括:以模型为基础提取重要图像块作为类别概念,构造结构概念图,以此为工具表示任意图像,再构建特征流动透明的推理网络模拟已有分类网络,观察概念图各部分的贡献,以实现决策的可解释;另一方面,人自主将每个部件作为一个概念,对部件进行属性整理,结合部件关系构造结构部件图。基于此,人可用类别的结构部件图更新结构概念图,重新训练推理网络,再通过知识蒸馏对原网络进行知识引导。基于这一双向交互方法,本发明可通过模型提供人易理解的推理逻辑,实现神经网络的可解释;同时允许人利用先验知识向网络提供反馈,以提高网络的性能。

    一种基于因果图的多阶段攻击过程重构方法

    公开(公告)号:CN115499169A

    公开(公告)日:2022-12-20

    申请号:CN202211008675.1

    申请日:2022-08-22

    Abstract: 一种基于因果图的多阶段攻击过程重构方法,包括:从检测到的网络攻击事件中提取事件主体,主体类型包括IP地址、进程、文件、服务;从主机的审计日志、网络流分析日志以及进程和服务的日志信息中抽取事件主体相关的日志信息;对提取到的日志信息进行预处理,从中提取更细粒度的主体作为因果图的节点;从日志信息中提取节点间的交互及时间戳信息,作为因果图的边;根据攻击事件主体和因果图的节点之间的关系,把攻击事件涉及的因果图的节点标记为恶性节点;把因果图恶性节点涉及的边按时间戳排序,构成反映整个攻击过程的详细步骤 序列,实现对整个多阶段攻击过程的细粒度重构;本发明基于检测到的零散攻击事件,从日志信息中重构出多阶段的攻击过程,更加细粒度地复盘了攻击链,更加有利于网络安全员对网络安全状况做出综合评判并进行针对性防御部署。

    一种基于特征对比损失的年龄估计方法

    公开(公告)号:CN115063862A

    公开(公告)日:2022-09-16

    申请号:CN202210731136.4

    申请日:2022-06-24

    Abstract: 该发明公开了一种基于特征对比损失的年龄估计方法,属于计算机视觉领域。该方法首先选择注意力机制作为特征提取网络的基本结构,并使用了基于注意力机制的偏移窗口变换网络作为特征提取网络的主要结构,用于从面部图像中提取鲁棒的年龄特征;然后设计了用于计算特征之间相对距离的距离估计网络,通过基于特征的对比损失引导特征空间保留标签空间的序约束关系,使得尾部特征能够利用头部特征的信息,进而提升尾部数据的预测准确度,从而解决年龄估计中的长尾分布问题。

    一种基于像素级噪声标签监督的光场显著性目标检测方法

    公开(公告)号:CN114549863B

    公开(公告)日:2022-07-22

    申请号:CN202210447954.1

    申请日:2022-04-27

    Abstract: 本发明公开了一种基于像素级噪声标签监督的光场显著性目标检测方法,包括以下步骤:S1、基于全焦图像及其对应的焦堆栈构建实验数据;S2、通过实验数据交互式引导融合网络,获得全焦图像初始噪声预测和光场焦堆栈图像初始噪声预测;S3、通过全焦图像初始噪声预测和光场焦堆栈图像初始噪声预测构建像素遗忘矩阵,得到融合后的最终预测显著性映射;S4、对融合后的最终预测显著性映射进行跨场景的噪声惩罚损失。本发明通过挖掘高维度光场数据中非常丰富的场景信息来引导和辅助显著性物体的检测,充分利用噪声标签中可用的显著性信息并减小噪声信息的置信度,有效地降低了显著性目标检测的预实验成本。

Patent Agency Ranking