-
公开(公告)号:CN109902612B
公开(公告)日:2021-01-08
申请号:CN201910133470.8
申请日:2019-02-22
Applicant: 北京工业大学
IPC: G06K9/00
Abstract: 本发明提供了一种基于无监督学习的监控视频异常检测方法。该方法首先提取视频中的运动块,然后从局部和全局两个不同的角度进行异常检测,通过多样化的检测角度使得检测结果更加准确。在局部异常检测中,首先对视频中的运动块进行扩展,然后以扩展后的运动块为基本检测单位,分别从时间维度、空间维度以及时空维度上比较该运动块与其邻域运动块之间的差异性;在全局异常检测中,首先对视频中的运动块进行聚类提取运动目标,然后在运动目标序列上使用滑动窗口,比较窗口内两个运动目标之间的差异性,最后基于一致性对检测结果进行优化。本发明适用监控视频的异常检测,计算复杂度低,检测结果准确,鲁棒性好。本发明在视频分析技术领域有着广泛的应用。
-
公开(公告)号:CN117635642A
公开(公告)日:2024-03-01
申请号:CN202311732310.8
申请日:2023-12-16
Applicant: 北京工业大学
IPC: G06T7/11 , G06N3/0464 , G06N3/045 , G06N3/08 , G06V10/80
Abstract: 本发明公开了一种基于多阶段特征分析视网膜血管图像分割方法,提出了一种通过混合池化方法实现多尺度通道注意力机制的跳跃连接,分为两个阶段:第一个阶段对于来自编码器不同分辨率的特征进行融合,将使用不同自适应池化操作得到的前景特征映射和背景特征映射分别使用通道注意力机制进行独立地特征分析,第二个阶段通过使用不同空洞率的空洞卷积进行不同特征映射的全局上下文信息提取;针对视网膜血管主干区域和末端血管形态差异较大,设计一种混合卷积方式;设计了一种多头自注意力机制,将输入特征映射进行全局上下文信息补充,随后利用位置编码信息与全局特征信息进行融合,使得网络对于分割区域的局部特征更加敏感。
-
公开(公告)号:CN111161317A
公开(公告)日:2020-05-15
申请号:CN201911390842.1
申请日:2019-12-30
Applicant: 北京工业大学
IPC: G06T7/246
Abstract: 本发明提供了一种基于多重网络的单目标跟踪方法,是一种采用深度学习的模型。该方法首先对视频序列的第一帧图像和当前帧图像进行裁剪,得到模板图像和待搜索图像;将模板图像和待搜索图像输入外观子网和语义子网,分别获得模板图像和待搜索图像的低层外观特征和高层语义特征,并进行特征融合,分别得到模板图像和待搜索图像的融合特征图;然后,基于模板图像和待搜索图像的融合特征图,使用相似性判别方法得到最终响应图;最后,根据最终响应图提供的信息获得跟踪结果。本发明解决了传统单目标跟踪方法无法有效检测到包含相似性背景的待搜索图像中的跟踪目标,以及基于深度学习的特征提取方法由于提取出的低层外观特征存在噪声而导致误检的问题。
-
公开(公告)号:CN109902612A
公开(公告)日:2019-06-18
申请号:CN201910133470.8
申请日:2019-02-22
Applicant: 北京工业大学
IPC: G06K9/00
Abstract: 本发明提供了一种基于无监督学习的监控视频异常检测方法。该方法首先提取视频中的运动块,然后从局部和全局两个不同的角度进行异常检测,通过多样化的检测角度使得检测结果更加准确。在局部异常检测中,首先对视频中的运动块进行扩展,然后以扩展后的运动块为基本检测单位,分别从时间维度、空间维度以及时空维度上比较该运动块与其邻域运动块之间的差异性;在全局异常检测中,首先对视频中的运动块进行聚类提取运动目标,然后在运动目标序列上使用滑动窗口,比较窗口内两个运动目标之间的差异性,最后基于一致性对检测结果进行优化。本发明适用监控视频的异常检测,计算复杂度低,检测结果准确,鲁棒性好。本发明在视频分析技术领域有着广泛的应用。
-
公开(公告)号:CN115908819A
公开(公告)日:2023-04-04
申请号:CN202211690834.0
申请日:2022-12-27
Applicant: 北京工业大学
IPC: G06V10/26 , G06V20/70 , G06V10/42 , G06V10/44 , G06V10/80 , G06V10/764 , G06V10/766 , G06V10/82 , G06N3/0455 , G06N3/0464 , G06N3/047 , G06N3/08
Abstract: 本方法公开了一种基于聚合卷积和自注意力特征的电子元器件X光图像空洞分割方法,首先对元器件数据集进行数据增强以扩充数据样本量,避免过拟合。其次,将数据输入到模型中进行分割,模型设计为U形Encoder‑Decoder结构,将引入CNN和Transformer混合分支的主干网络作为Encoder模块提取特征,聚合了图像的局部特征和全局特征;设计Decoder结构对Encoder模块输出进行上采样,并在每一层上采样中使用跳跃连接,融合下采样特征使后续上采样特征更加精细,图像还原更精确,分割精度更高。最后,使用LovaszSoftmax损失函数指导训练,得到分割模型。本方法能够用于电子元器件表面空洞缺陷分割任务,具有成本低、实时检测、高准确性等优点。
-
公开(公告)号:CN116244663A
公开(公告)日:2023-06-09
申请号:CN202310218073.7
申请日:2023-03-08
Applicant: 北京工业大学
IPC: G06F18/25 , A61B5/16 , A61B5/00 , A61B5/398 , A61B5/372 , A61B5/346 , G06F18/10 , G06F18/214 , G06F18/2415 , G06N3/045 , G06N3/0442 , G06N3/0464 , G06N3/047 , G06N3/084
Abstract: 本发明公开了一种面向认知状态检测的多生理信号融合的分类方法。首先使用EMD算法对数据集中的信号进行分解,信号分解后得到若干分量,将不同信号的其中一部分分量进行交换,重组后得到新信号,通过这种方法扩充数据集,达到数据增强的目的。之后将不同的生理信号数据按采集位置放入到数据矩阵中,以此达到多生理信号融合的目的。最后将处理好的数据矩阵放入设计的深度学习网络中进行特征提取及分类,得到信号所属的认知状态。本发明采用数据增强方法避免生理信号数据过少导致的过拟合现象,采用多生理信号融合得到比单一生理信号更高的分类准确率,使认知状态检测的效果得到了提升。
-
-
-
-
-