-
公开(公告)号:CN108537119B
公开(公告)日:2020-07-10
申请号:CN201810184700.9
申请日:2018-03-06
Applicant: 北京大学
Abstract: 一种小样本视频识别方法,基于深度神经网络与层级实时记忆,使用每类有多个训练样本的可见类与每类只有少量训练样本的不可见类,对不可见类的测试样本进行分类。首先,在可见类视频上进行深度网络预训练;随后,使用预训练得到的模型与可见类的视频对层级实时记忆网络进行训练,使网络可以在不可见类上进行重要程度的预测;同时,使用预训练得到的模型,在不可见类上对小样本进行距离学习,增大样本的类间距离,缩小样本的类内距离;最后,使用训练得到的层级实时记忆网络对测试视频选帧,使用距离学习得到的模型在选出来的帧上做分类任务。由此,本方法可以实现小样本下的视频识别,更贴近真实识别场景下的应用。
-
公开(公告)号:CN110427823A
公开(公告)日:2019-11-08
申请号:CN201910579928.2
申请日:2019-06-28
Applicant: 北京大学
Abstract: 本发明公开了一种基于视频帧与脉冲阵列信号的联合目标检测方法和装置,该方法包括:将视频帧和脉冲阵列信号作为目标检测的输入;将连续的脉冲阵列信号进行自适应划分;根据视频帧频率与脉冲阵列信号划分频率的关系,进行同步融合或异步融合检测;将视频帧与脉冲阵列信号以特征表达形式进行融合;输出检测结果。本发明可有效地利用脉冲阵列信号的高时间分辨率和高动态能力来提供传统相机的目标检测精度,尤其解决高速运动模糊、过曝光或低光照等场景的检测难题。在无人驾驶视觉检测与导航、无人机巡航与定位、机器人视觉导航和视频监控等涉及高速运动领域存在广泛应用潜力。
-
公开(公告)号:CN110288677A
公开(公告)日:2019-09-27
申请号:CN201910425357.7
申请日:2019-05-21
Applicant: 北京大学
Abstract: 本发明涉及图像生成领域,特别涉及一种基于可形变结构的行人图像生成方法和装置。具体包括以下步骤:步骤一、对行人图片和目标姿态图片按照部位结构进行分割操作,进行提取mask操作;步骤二、然后进行部位生成操作,得到部位生成图片;步骤三、对部位生成图片进行结构化合并操作,得到结构化合并图片;步骤四、进行整体生成操作,得到生成图片。本发明在考虑人体可形变结构的基础上,降低训练的代价,提升算法的性能。
-
公开(公告)号:CN109068024A
公开(公告)日:2018-12-21
申请号:CN201810694419.X
申请日:2018-06-29
Applicant: 北京大学
Abstract: 本发明公开了一种对时空信号进行滤波的方法,针对所述时空信号,记录每个空间位置的信号并进行累积,得到信号累积强度值;分析当前空间位置的信号在空间域、时间域或频率域上是否孤立,过滤该空间位置的孤立信号。本发明的应用对象不再是传统视频而是脉冲阵列视频;通过使用几种过滤方法过滤掉无用的信息,减少了计算资源的浪费;而且删去不相关信息,提取有用信息,是信号采集中非常重要的一步,可以应用于适于动态视觉传感器的全部应用场景。
-
公开(公告)号:CN104168482B
公开(公告)日:2018-12-21
申请号:CN201410302970.7
申请日:2014-06-27
Abstract: 本发明公开了一种视频编解码方法及装置,在本方案中,由于在编码过程中,可从像素级对各待编码原始视频图像进行分层,因此会更为灵活地支持视频编码过程中对象的层次表示,并且还可达到提高视频编码过程中对视频图像的轮廓描述的精确性的效果。再有,由于在编码过程中,还可将用于反映原始视频图像中的各像素所对应的视频内容层级的像素属性标识值也编入输出视频位流,以便在解码出原始视频图像的同时也可解码出各像素的像素属性标识信息、进而根据各像素的像素属性标识信息、提取出不同层次的对象,从而还可达到更为灵活地支持视频解码过程中对象的层次表示以及提高视频解码过程中对视频图像的轮廓描述的精确性的目的。
-
公开(公告)号:CN109039980A
公开(公告)日:2018-12-18
申请号:CN201810761800.3
申请日:2018-07-12
Applicant: 北京大学
IPC: H04L27/26
Abstract: 本发明提供了一种时空脉冲阵列信号量化的方法,通过信号采样器从局部空间位置采集时域信号,生成时域上的脉冲序列;多个信号采样器阵列按空间位置相互关系排列成脉冲阵列信号;将脉冲阵列信号按一组规定的间隔在时域和空域进行离散化,用最接近的数值来表示该信号的采样值,作为对所述时空脉冲阵列信号的量化。该方法包括:均匀量化,将脉冲阵列信号按照等间隔进行量化;非均匀量化,依据先验信息和量化参数确定不同区间量化间隔,将脉冲阵列信号进行非均匀量化。本发明为同时兼顾时域信息和空域信息的有效的脉冲阵列信号量化方法,满足时域和空域尺度分析的综合需求。
-
公开(公告)号:CN108881906A
公开(公告)日:2018-11-23
申请号:CN201710338072.0
申请日:2017-05-15
Applicant: 北京大学
IPC: H04N19/117 , H04N19/13 , H04N19/18
CPC classification number: H04N19/117 , H04N19/13 , H04N19/18
Abstract: 本申请提出了一种图像重构方法,包括:获取与在空间位置上信号相关的脉冲序列中脉冲之间的间隔信息,所述空间位置信号的累积强度超过预定阈值产生脉冲并按照顺序排列成所述脉冲序列;基于所述预定阈值和所述间隔信息确定所述空间位置至少部分时刻在图像重构时的像素值。该重构方法能够精细地重构出高速运动对象的运动过程,同时,重构过程中通过分析脉冲之间时间间隔的变化并建立这种变化与对应的空间位置的重构像素值之间的映射关系,以极小的处理量重现带有纹理的运动对象。另一方面,由于采样数据中通过累积的方式包含了所有时刻的光强信息,因此本申请的重构方法能够重构任意时刻的图像,突破了传统视频只能保留帧采样时刻的图像的局限。
-
公开(公告)号:CN108764292A
公开(公告)日:2018-11-06
申请号:CN201810390879.3
申请日:2018-04-27
Applicant: 北京大学
CPC classification number: G06K9/6256 , G06K2209/21 , G06N3/0454 , G06N3/0481 , G06N3/084
Abstract: 本发明提供了一种基于弱监督信息的深度学习图像目标映射及定位方法。该方法包括:使用带有类别标签的图像数据分别训练两个深度卷积神经网络框架,得到分类模型M1和分类模型M2,并获取全局带参可学习池化层参数;使用新的分类模型M2对测试图像进行特征提取,得到特征图,根据特征图通过特征类别映射及阈值法得到初步定位框;使用选择性搜索方法对测试图像进行候选区域提取,使用分类模型M1筛选类别出候选框集合;对初步定位框和候选框进行非极大值抑制处理,得到测试图像最终的目标定位框。本发明引入全局带参可学习池化层,能够学习得到关于目标类别j的更好的特征表达,并通过使用选择性特征类别映射的方式,有效得到图像中目标物体的位置信息。
-
公开(公告)号:CN107566798A
公开(公告)日:2018-01-09
申请号:CN201710810517.0
申请日:2017-09-11
Applicant: 北京大学
IPC: H04N7/18 , H04N19/172 , G06K9/46
Abstract: 本申请公开了一种数据处理的系统、方法及装置,可以在前端设备采集视频后,提取该视频的每个原始帧图像对应的特征,之后再将每个原始帧图像及其对应的特征进行编码,并发送至后台设备,而后台设备在对接收到的已编码的数据进行解码后,便可根据获得的重建帧图像及其对应的特征进行数据处理。
-
公开(公告)号:CN103902966B
公开(公告)日:2018-01-05
申请号:CN201210590580.5
申请日:2012-12-28
Applicant: 北京大学
Abstract: 本发明涉及一种基于序列时空立方体特征的视频交互事件分析方法及装置,该方法包括:基于监控视频的检测跟踪结果将该监控视频划分成若干时空立方体序列;在每个时空立方体内提取对象轨迹、表观和局部运动描述子,并将提取的描述子组成特征片段;对所有时空立方体内的特征片段进行重构以构建序列时空立方体特征,利用该序列时空立方体特征进行交互事件分类检测。该装置包括预处理模块、视频序列划分模块、时空立方体特征提取模块、时序特征重构模块和序列特征分类模块。本发明实现了对监控视频内容的高层语义层描述,并且利用基于动态时间对齐核函数的多核支持向量机,实现了变长序列特征分类,从而实现了对监控视频流交互事件的智能检测。
-
-
-
-
-
-
-
-
-