-
公开(公告)号:CN113542780A
公开(公告)日:2021-10-22
申请号:CN202110649651.3
申请日:2021-06-10
Applicant: 北京工业大学
IPC: H04N21/2187 , H04N21/44 , H04N19/86 , G06N3/04 , G06N3/08
Abstract: 本发明提供一种网络直播视频的压缩伪影去除方法,该方法包括:获取压缩视频;将所述压缩视频输入压缩伪影去除模型中,得到所述压缩伪影去除模型输出的与所述压缩视频相对应的高质量恢复视频;其中,所述压缩伪影去除模型利用循环神经网络RNN和膨胀卷积,对未知压缩码率且含有压缩伪影的所述压缩视频进行恢复,以生成所述高质量恢复视频。本发明可以在未知压缩码率的状况下,通过使用单个网络模型来恢复压缩视频,从而可以提供高质量的网络直播视频。
-
公开(公告)号:CN109840509B
公开(公告)日:2020-12-01
申请号:CN201910119305.7
申请日:2019-02-15
Applicant: 北京工业大学
Abstract: 本发明提供了一种网络直播视频中不良主播的多层次协同识别方法及装置,涉及视频处理的技术领域,包括:从目标视频中提取图像样本、弹幕样本和语音样本;根据图像样本、弹幕样本和语音样本分别计算出图像分类序列、语音分类序列和弹幕分类序列;根据D‑S证据理论对图像分类序列、语音分类序列和弹幕分类序列进行融合处理,生成视频分类序列;根据视频分类序列识别出目标视频的行为分类。通过融合图像、语音和弹幕三个识别结果,提高了视频识别的鲁棒性,提高了网络直播视频中主播的不良行为的识别精度。
-
公开(公告)号:CN107507250B
公开(公告)日:2020-08-21
申请号:CN201710406983.2
申请日:2017-06-02
Applicant: 北京工业大学
Abstract: 一种基于卷积神经网络的面色舌色图像颜色校正方法涉及数字图像处理方法。算法主要包括离线部分和在线部分。离线部分由训练数据采集、颜色校正卷积神经网络网络框架搭建和训练组成,在线部分则是图像颜色校正和颜色校正效果评价。CNN模仿人类的认知过程,即从局部特征到全局特征的逐层抽象。将卷积神经网络应用于颜色校正中,可以获得较为理想的颜色重现效果。本发明通过采用深度卷积神经网络方法,对稳定光学环境中采集到的人脸面色和舌色进行颜色校正,重现在相同光学环境中目标对象真是呈现的颜色信息。
-
公开(公告)号:CN111160110A
公开(公告)日:2020-05-15
申请号:CN201911244819.1
申请日:2019-12-06
Applicant: 北京工业大学
Abstract: 本发明实施例提供一种基于人脸特征和声纹特征识别主播的方法及装置,其中方法包括:根据预先训练的神经网络模型,从直播视频中提取待识别主播的身份特征,根据局部敏感哈希方法将所述身份特征存储至预先生成的哈希桶中,将与所述身份特征处于同一哈希桶内的至少一个特征作为待匹配的样本主播的身份特征;计算所述样本主播的身份特征与所述待识别主播的身份特征间的相似度,将相似度最高的样本主播作为所述待识别主播。本发明实施例适应直播条件下识别主播的要求。
-
公开(公告)号:CN110728694A
公开(公告)日:2020-01-24
申请号:CN201910956780.X
申请日:2019-10-10
Applicant: 北京工业大学
Abstract: 本发明涉及一种基于持续学习的长时视觉目标跟踪方法,该方法包括网络模型设计、模型初始化、在线跟踪和模型更新。针对长时视觉目标跟踪设计了深度神经网络结构,经过模型初始化获得初始化网络模型,然后利用初始化网络模型进行在线跟踪,在跟踪过程中利用持续学习的方法进行长时或短时模型更新,适应目标在跟踪过程中的各种变化。本发明把传统视觉目标跟踪的模型在线更新过程转换为持续学习的过程,从视频的所有历史数据整体建立目标的完整外观描述,有效提升了长时视觉跟踪的鲁棒性。本发明所述的方法可为智能视频监控、人机交互、视觉导航等应用需求提供长时视觉目标跟踪的有效解决方案。
-
公开(公告)号:CN107330889B
公开(公告)日:2019-11-15
申请号:CN201710562784.0
申请日:2017-07-11
Applicant: 北京工业大学
Abstract: 一种基于卷积神经网络的中医舌色苔色自动分析方法属于计算机视觉领域和中医舌诊领域,具体涉及深度学习、图像处理等技术。该方法可以有效提高舌色苔色自动分析的准确度和鲁棒性。本发明分类准确度高。与传统的“特征提取+分类器”方案相比,卷积神经网络是一种端到端的结构,特征提取与分类两个过程在同一框架下完成,避免了对特征和分类器选择的依赖。在分类精度上比传统方法具有明显优势,可以满足实际应用需求。
-
公开(公告)号:CN106997380B
公开(公告)日:2019-07-12
申请号:CN201710168022.2
申请日:2017-03-21
Applicant: 北京工业大学
IPC: G06F16/583 , G06F21/60 , G06T1/00
Abstract: 基于DCGAN深度网络的成像光谱图像安全检索方法属于成像光谱图像领域。本发明利用DCGAN深度网络实现对成像光谱图像特征的高度表达,提出一种新的加密域成像光谱图像安全检索方法。首先利用深度卷积生成对抗网络(Deep Convolutional Generative Adversarial Network,DCGAN)联合提取成像光谱图像的深度光谱‑空间特征,精准地表征成像光谱图像内容;同时为了保障遥感图像检索过程中的安全性,基于加密后特征相似度不变的准则,采用最小哈希(Min‑Hash)方法对深度特征进行加密,实现对深度特征的保护;最后在不解密的情况下,通过比较最小哈希值相等个数直接对图像特征进行Jaccard相似性距离度量,返回与查询图像相似的图像,在实现检索的同时,保障信息的安全性。
-
公开(公告)号:CN104915636B
公开(公告)日:2019-04-12
申请号:CN201510178609.2
申请日:2015-04-15
Applicant: 北京工业大学
Abstract: 本发明公开了一种基于多级框架显著性特征的遥感影像道路识别方法,涉及图像处理领域,具体涉及遥感处理识别领域。本发明方法充分利用遥感影像中道路的光谱、物理以及形态特征,对传统的显著性特征进行改进,提出遥感影像的光谱差异和局部线性两种显著性特征,同时,对所提取的道路网络进行近一步分析,得出该路段所属类型。首先提取遥感影像的显著性特征,并将光谱差异和局部线性两种特征进行融合,建立多级框架显著图,然后采取RPS方法、MAT方法等对道路网络进行优化,近一步消除非道路区域,最后提取道路网络的特征,并采用增量学习方法对道路进行分类,实现多级框架显著性特征的遥感影像道路识别。本发明提升了遥感图像的道路识别率。
-
公开(公告)号:CN105335926B
公开(公告)日:2018-08-07
申请号:CN201510712551.5
申请日:2015-10-28
Applicant: 北京工业大学
IPC: G06T3/00
Abstract: 种基于像素值量化和小波分析的全自动照片油画化方法。该方法利用小波分析技术将数字照片的内容划分为平滑区域和纹理区域,然后分别采用不同的量化步长对平滑区域和纹理区域分别进行像素值量化,最后在小波域中进行图像纹理融合,从而得到具有油画风格的图像。本发明具体包括以下步骤:计算均匀度;获得细节图;像素值量化;纹理融合。与现有技术相比,本发明具有以下明显的优势和有益的效果。照片油画化的所有步骤均由计算机算法实现,无需额外的人工处理步骤;算法实现的过程是全自动的,在算法执行过程中不需要人工设置任何技术参数,仅需给定输入的照片图像即可获得结果,操作简单;计算量较小,算法运行速度快。
-
公开(公告)号:CN107516312A
公开(公告)日:2017-12-26
申请号:CN201710692254.8
申请日:2017-08-14
Applicant: 北京工业大学
Abstract: 一种应用浅层神经网络进行中医面色自动分类的方法属于计算机视觉领域。设计的浅层网络层数共有5层,采用三种不同的层结构,分别为输入层、特征提取层、输出层。输入层由一个卷积层和修正线性单元组成;特征提取层由3层网络组成,前两层的每层都由一个卷积层和ReLU激活函数组成,在卷积层和ReLU之间都有一个批归一化,并在特征提取层的第二个ReLU后面加入池化层,特征提取层的第三层是一个全连接层,后接一个修正线性单元ReLU;输出层由全连接层组成,后加一个softmax分类器。本发明在分类精度上有明显优势,对缩放、平移、旋转等畸变具有不变性,有很强的鲁棒性,能够有效的提高分类精度,将深度学习的理论应用于中医面诊客观化研究。
-
-
-
-
-
-
-
-
-