-
公开(公告)号:CN106909924B
公开(公告)日:2020-08-28
申请号:CN201710087670.5
申请日:2017-02-18
Applicant: 北京工业大学
Abstract: 一种基于深度显著性的遥感影像快速检索方法属于计算机视觉领域,具体涉及深度学习、显著性目标检测和图像检索等技术。本发明以遥感影像为研究对象,利用深度学习技术,研究了一种遥感影像的快速检索方法。首先采用全卷积神经网络构建多任务显著性目标检测模型,该模型同时进行显著性检测任务和语义分割任务,在网络预训练过程中学习遥感影像的深度显著性特征。然后改进深度网络结构,加入哈希层微调网络,学习得到遥感影像的二进制哈希码。最后综合利用显著性特征和哈希码进行相似性度量。本发明对于实现遥感影像准确、高效检索切实可行并具有重要应用价值。
-
公开(公告)号:CN110363716A
公开(公告)日:2019-10-22
申请号:CN201910552748.5
申请日:2019-06-25
Applicant: 北京工业大学
Abstract: 本发明公开了一种基于条件生成对抗网络复合降质图像高质量重建方法,该方法基于条件生成对抗网络对无人机航拍、视频监控、智能交通等户外视觉系统中复合降质图像进行高质量重建,包括整体流程、复合降质图像样本库的建立、网络模型搭建与训练、复合降质图像高质量重建部分。通过条件生成对抗网络对无人机航拍、视频监控、智能交通等户外视觉系统得到的复合降质图像进行统一高质量重建。本发明提出了建立对应清晰-复合降质图像样本库的方案;采用条件生成对抗网络,建立一种复合降质图像高质量重建方法,可完成存在雾霾、模糊、压缩效应等复合降质图像的统一重建;采用轻型的网络,不仅提高了图像重建速度,也更利于此方法在实践中的应用。
-
公开(公告)号:CN120013814A
公开(公告)日:2025-05-16
申请号:CN202411864850.6
申请日:2024-12-18
Applicant: 北京工业大学
IPC: G06T5/77 , G06T5/60 , G06V10/42 , G06V10/44 , G06V10/80 , G06V10/82 , G06N3/0455 , G06N3/0464
Abstract: 本发明实施例提供一种基于Transformer的图像恢复方法,该方法包括:对输入图像进行初步处理后获得图像特征;将图像特征输入至不同网络深度的局部‑区域‑全局感知注意基础模块LRG中以获取融合后的图像特征;对融合后的图像特征执行下采样操作,以获取不同维度的图像特征;将不同维度的图像特征逐层融合,将融合后的不同维度的图像特征上采样至图像特征的特征大小;将上采样后的特征与融合后的图像特征进行concatenate操作,并融入输入图像的图像特征以得到输出图像特征,将输出图像特征转换为输出图像。本公开能够将局部和全局的多尺度特征进行融合,并将融合后的多尺度特征信息进行通道维度和空间维度的融合,增强通道间的信息交互和空间建模能力。
-
公开(公告)号:CN114037933B
公开(公告)日:2025-05-09
申请号:CN202111235715.1
申请日:2021-10-22
Applicant: 北京工业大学
IPC: G06V20/40 , G06V10/774 , G06V10/26
Abstract: 本发明公开了隧道抛洒物检测的方法、装置、电子设备及存储介质,包括:获取隧道的视频数据;对视频数据采用平均帧处理,得到隧道平均帧图像;将隧道平均帧图像输入至训练好的分割模型,得到隧道平均帧图像中不同类型抛洒物对应区域的分割结果;根据分割结果确定抛洒物的位置信息。本发明通过分割模型得到隧道平均帧图像中不同类型抛洒物对应区域的分割结果,避免了车辆灯光等噪声信息干扰,且不受抛洒物的类别、形状、位置的影响,能够快速准确的定位交通视频中抛洒物位置。
-
公开(公告)号:CN112801192B
公开(公告)日:2024-03-19
申请号:CN202110148551.2
申请日:2021-01-26
Applicant: 北京工业大学
IPC: G06F18/213 , G06F18/214 , G06N3/0464 , G06N3/084
Abstract: 一种基于深度神经网络的扩展LargeVis图像特征降维方法属于图像处理领域。现有Largevis降维方法是利用数据间的距离关系而进行降维操作过程,因此无法实现对单一的高维数据进行降维。该方法利用深度神经网络对LargeVis隐式的高维数据到低维数据的映射关系进行建模,构建出映射函数f,使得LargeVis算法能够实现对单一高维数据的降维,同时能够取得更优良的降维性能。
-
公开(公告)号:CN114339030A
公开(公告)日:2022-04-12
申请号:CN202111429346.X
申请日:2021-11-29
Applicant: 北京工业大学
IPC: H04N5/232 , G06K9/62 , G06N3/04 , G06N3/08 , H04N19/42 , H04N19/503 , H04N21/2187
Abstract: 本发明提供了一种基于自适应可分离卷积的网络直播视频稳像方法。该方法包括:建立视频帧样本库、网络模型搭建、网络训练、视频稳像。将所述得到的训练数据集输入视频稳像网络中,得到所述稳像模型输出的稳定视频帧;其中,所述稳像模型利用自适应可分离卷积和可变形卷积,将预测得到的卷积核应用在输入的两帧连续帧上,以生成稳定的中间帧。本发明通过直接生成中间帧的方法进行稳像,避免了对稳像后的视频帧进行裁剪,从而保持原始视频的分辨率。
-
公开(公告)号:CN114004760A
公开(公告)日:2022-02-01
申请号:CN202111234337.5
申请日:2021-10-22
Applicant: 北京工业大学
Abstract: 本发明提供一种图像去雾方法、电子设备、存储介质和计算机程序产品,方法包括获取待去雾的目标雾霾图像;将目标雾霾图像输入至去雾模型,对目标雾霾图像进行去雾处理,获得去雾模型输出的目标去雾图像,去雾模型是基于不成对的清晰图像和雾霾图像构成的训练图像集,对待训练模型进行无监督训练得到的,待训练模型包括用于进行加雾转换处理和去雾转换处理的多尺度注意力模块,及用于区分训练图像集的真实图像和多尺度注意力模块的生成图像的判别器。本发明的去雾模型是基于不成对的清晰图像和雾霾图像构成的训练图像集进行无监督训练得到的,从而避免成对图像训练集对去雾模型训练的限制,进而提高图像去雾的性能。
-
公开(公告)号:CN110363716B
公开(公告)日:2021-11-19
申请号:CN201910552748.5
申请日:2019-06-25
Applicant: 北京工业大学
Abstract: 本发明公开了一种基于条件生成对抗网络复合降质图像高质量重建方法,该方法基于条件生成对抗网络对无人机航拍、视频监控、智能交通等户外视觉系统中复合降质图像进行高质量重建,包括整体流程、复合降质图像样本库的建立、网络模型搭建与训练、复合降质图像高质量重建部分。通过条件生成对抗网络对无人机航拍、视频监控、智能交通等户外视觉系统得到的复合降质图像进行统一高质量重建。本发明提出了建立对应清晰‑复合降质图像样本库的方案;采用条件生成对抗网络,建立一种复合降质图像高质量重建方法,可完成存在雾霾、模糊、压缩效应等复合降质图像的统一重建;采用轻型的网络,不仅提高了图像重建速度,也更利于此方法在实践中的应用。
-
公开(公告)号:CN113542780A
公开(公告)日:2021-10-22
申请号:CN202110649651.3
申请日:2021-06-10
Applicant: 北京工业大学
IPC: H04N21/2187 , H04N21/44 , H04N19/86 , G06N3/04 , G06N3/08
Abstract: 本发明提供一种网络直播视频的压缩伪影去除方法,该方法包括:获取压缩视频;将所述压缩视频输入压缩伪影去除模型中,得到所述压缩伪影去除模型输出的与所述压缩视频相对应的高质量恢复视频;其中,所述压缩伪影去除模型利用循环神经网络RNN和膨胀卷积,对未知压缩码率且含有压缩伪影的所述压缩视频进行恢复,以生成所述高质量恢复视频。本发明可以在未知压缩码率的状况下,通过使用单个网络模型来恢复压缩视频,从而可以提供高质量的网络直播视频。
-
公开(公告)号:CN109840509B
公开(公告)日:2020-12-01
申请号:CN201910119305.7
申请日:2019-02-15
Applicant: 北京工业大学
Abstract: 本发明提供了一种网络直播视频中不良主播的多层次协同识别方法及装置,涉及视频处理的技术领域,包括:从目标视频中提取图像样本、弹幕样本和语音样本;根据图像样本、弹幕样本和语音样本分别计算出图像分类序列、语音分类序列和弹幕分类序列;根据D‑S证据理论对图像分类序列、语音分类序列和弹幕分类序列进行融合处理,生成视频分类序列;根据视频分类序列识别出目标视频的行为分类。通过融合图像、语音和弹幕三个识别结果,提高了视频识别的鲁棒性,提高了网络直播视频中主播的不良行为的识别精度。
-
-
-
-
-
-
-
-
-