-
公开(公告)号:CN119904844A
公开(公告)日:2025-04-29
申请号:CN202411665051.6
申请日:2024-11-20
Applicant: 北京工业大学
Abstract: 本公开提供一种驾驶员行为识别方法、装置、设备及存储介质,属于计算机图像识别技术领域。驾驶员行为识别方法包括:获取包含驾驶员行为的视频帧序列和热图帧序列;利用多模态交互神经网络和时间权重自适应卷积,基于视频帧序列和热图帧序列,生成第一特征图和第二特征图;时间权重自适应卷积用于基于每个帧在各自时间序列中的位置为每个帧赋予相应的时间权重;第一特征图为基于时间加权的骨架引导的外观特征图,第二特征图为基于时间加权的外观引导的骨架特征图;基于第一特征图和第二特征图进行驾驶员行为识别,得到识别结果。本公开通过引入多模态交互和时间权重自适应机制,专注于驾驶员的细粒度行为,有效提高识别结果的准确性。
-
公开(公告)号:CN119295599A
公开(公告)日:2025-01-10
申请号:CN202411237551.X
申请日:2024-09-05
Applicant: 北京工业大学
Abstract: 本发明实施例提供一种轨道交通图像的生成方法,所述方法包括:获取轨道交通图像并输入至图像生成网络中,将图像初步处理为隐空间特征,并融合特征提取模块生成的特征提示以生成辅助特征;根据辅助特征指导扩散模型对经过初步处理的图像执行去噪过程,得到生成图像特征,将生成图像特征解码为输出图像。本发明所提出的生成方法通过使用少量的图像实现对扩散模型的微调,并生成多样化的图像;利用图像特征代替文本特征克服了文图数据标注繁琐、模型难以训练的问题;利用隐空间特征,使扩散模型在生成图像的过程中降低资源消耗,快速高效的完成轨道交通图像生成任务。
-
公开(公告)号:CN114339030B
公开(公告)日:2024-04-02
申请号:CN202111429346.X
申请日:2021-11-29
Applicant: 北京工业大学
IPC: H04N23/68 , H04N19/42 , H04N19/503 , H04N21/2187 , G06V10/80 , G06V10/82 , G06T7/269 , G06N3/0464 , G06N3/0455 , G06N3/0895
Abstract: 本发明提供了一种基于自适应可分离卷积的网络直播视频稳像方法。该方法包括:建立视频帧样本库、网络模型搭建、网络训练、视频稳像。将所述得到的训练数据集输入视频稳像网络中,得到所述稳像模型输出的稳定视频帧;其中,所述稳像模型利用自适应可分离卷积和可变形卷积,将预测得到的卷积核应用在输入的两帧连续帧上,以生成稳定的中间帧。本发明通过直接生成中间帧的方法进行稳像,避免了对稳像后的视频帧进行裁剪,从而保持原始视频的分辨率。
-
公开(公告)号:CN116433721A
公开(公告)日:2023-07-14
申请号:CN202310218025.8
申请日:2023-03-08
Applicant: 北京工业大学
Abstract: 本发明涉及一种基于生成伪融合特征的室外RGB‑T目标跟踪算法,包括生成伪融合特征网络和天气适应性增强网络。生成伪融合特征网络包括对融合特征采用先逐通道卷积再点积的方式获取更丰富的融合特征和采用低计算量的通道交换的方式实现多模态之间的信息交流。天气适应性增强网络关注跟踪器在执行室外跟踪任务时对天气类型变化的适应能力,采用多分支天气类型预测结构,计算多个天气特征提取分支对特征图的天气类型预测概率,并采用双模态并行预测的方式,提高跟踪器对天气变化的适应性,保证信息的可靠性。本发明结合多模态数据的异质性实现优势互补、提升特征的表征能力,并提高应对天气变化的能力,实现鲁棒的跟踪。
-
公开(公告)号:CN113542780B
公开(公告)日:2023-01-20
申请号:CN202110649651.3
申请日:2021-06-10
Applicant: 北京工业大学
IPC: H04N21/2187 , H04N21/44 , H04N19/86 , G06N3/04 , G06N3/08
Abstract: 本发明提供一种网络直播视频的压缩伪影去除方法,该方法包括:获取压缩视频;将所述压缩视频输入压缩伪影去除模型中,得到所述压缩伪影去除模型输出的与所述压缩视频相对应的高质量恢复视频;其中,所述压缩伪影去除模型利用循环神经网络RNN和膨胀卷积,对未知压缩码率且含有压缩伪影的所述压缩视频进行恢复,以生成所述高质量恢复视频。本发明可以在未知压缩码率的状况下,通过使用单个网络模型来恢复压缩视频,从而可以提供高质量的网络直播视频。
-
公开(公告)号:CN108320295B
公开(公告)日:2022-06-07
申请号:CN201810135492.3
申请日:2018-02-09
Applicant: 北京工业大学
Abstract: 一种基于自适应阈值时空信息的旧电影斑点噪声检测方法涉及数字图像处理领域,通过对时间域和空间域信息进行全面约束,对老旧电影中的斑点损伤进行检测,检测出的斑点模板图可以清晰反映出斑点所在位置信息。首先对待检测帧的图像进行运动估计,以像素块为单位在前后帧之间进行匹配,对于每一帧图像得到两个运动矢量矩阵,分别记录当前帧图像的每个像素在前、后帧对应位置的运动矢量。然后基于上一步得到的运动估计结果,采用改进的SDI算法和ESROD算法对斑点进行全面检测,并经过自适应调整阈值,将所有可能成为斑点的区域都检测出来。之后进一步对斑点区域进行筛选,使用时空约束条件筛选出精确的斑点位置,得到斑点检测结果。
-
公开(公告)号:CN114240994A
公开(公告)日:2022-03-25
申请号:CN202111302041.2
申请日:2021-11-04
Applicant: 北京工业大学
Abstract: 本发明提供一种目标跟踪方法、装置、电子设备及存储介质。其中,目标跟踪方法包括:获取初始特征图像;所述初始特征图像包括目标对象;将所述初始特征图像输入到分类及回归网络中,分别得到分类特征图像和回归特征图像;对所述分类特征图像和所述回归特征图像进行位置信息处理,得到位置特征图像;对所述位置特征图像进行相关性处理,得到相关特征图像;基于所述相关特征图像,得到所述目标对象的目标跟踪信息。本发明能够提高目标跟踪的精确度。
-
公开(公告)号:CN114037932A
公开(公告)日:2022-02-11
申请号:CN202111234339.4
申请日:2021-10-22
Applicant: 北京工业大学
IPC: G06V20/40 , G06V10/762 , G06V10/80 , G06K9/62 , G01S13/86
Abstract: 本发明提供一种交通异常事件检测方法、电子设备、存储介质和程序产品,方法包括获取交通视频数据和雷达数据;将交通视频数据的平均帧图像输入至车辆检测模型,进行可疑车辆检测,获得车辆检测模型输出的可疑车辆及其位置信息;对位置信息进行聚类处理,获得聚类结果,基于聚类结果判断可疑车辆是否为异常车辆;若可疑车辆为异常车辆,则基于聚类结果对位置信息进行过滤处理,获得异常车辆的目标位置信息,基于雷达数据和目标位置信息,进行决策级融合,获得异常车辆的异常事件类别。本发明占用更少的内存资源,可在终端设备上进行处理,无需在远程设备上进行处理,从而避免远程传输数据出现错检漏检的情况,进而提高交通异常事件检测的准确率。
-
公开(公告)号:CN108346159B
公开(公告)日:2021-10-15
申请号:CN201810080582.7
申请日:2018-01-28
Applicant: 北京工业大学
Abstract: 本发明公开了一种基于跟踪‑学习‑检测的视觉目标跟踪方法,属于计算机视觉领域。首先,本发明从深度特征和核相关滤波的角度出发,建立了一种基于跟踪‑学习‑检测的视觉目标跟踪方法,可完成复杂场景下长时间目标跟踪的任务;其次,本发明针对卷积神经网络的特征图进行了研究和测试,并分析了不同卷积层的特征图对视觉目标跟踪的影响。最后,本发明融入目标检测的思想,可以进行跟踪失败后对目标进行再检测,从而实现对单目标的长时间跟踪。本方法将相关滤波跟踪方法与深度学习相结合,从而提高目标在复杂场景下目标跟踪的鲁棒性。
-
公开(公告)号:CN108961289B
公开(公告)日:2021-05-07
申请号:CN201810772537.8
申请日:2018-07-13
Applicant: 北京工业大学
Abstract: 本发明公开了一种基于失衡度先验的行人检测方法,属于数字图像/视频信号处理领域。首先提出了一种基于颜色差分的彩色图像边缘检测方法——颜色差分图(Color Difference Map,CDM),根据颜色变化信息实现边缘检测。然后,利用颜色差分图CDM定义了失衡度(Imbalance,imba)来定量描述行人样本的对称性,提出了失衡度先验概念,对选取的运动目标候选区域进行粗分类。最后,利用HOG特征和SVM相结合的方法进行细分类,实现行人检测。本发明提出的行人检测方法能够快速排除大量行人负样本,在提高行人检测准确率的同时大幅提高行人检测速度。
-
-
-
-
-
-
-
-
-