-
公开(公告)号:CN105740422A
公开(公告)日:2016-07-06
申请号:CN201610066163.9
申请日:2016-01-29
Applicant: 北京大学
IPC: G06F17/30
Abstract: 本发明公开了一种行人检索方法及装置,所述方法包括:对预设训练数据进行多任务字典学习,得到目标字典;所述预设训练数据包括当前场景下的行人图片数据和非当前场景下的行人图片数据;所述非当前场景下的行人图片数据为已标注好行人身份信息的数据;所述当前场景为待检索的行人图片所属的场景;对所述待检索的行人图片进行处理,获取所述待检索的行人图片的特征数据;利用所述目标字典对所述特征数据进行编码,得到目标编码系数;利用所述目标编码系数进行检索匹配,获取与所述待检索的行人图片匹配的图片。本发明在训练过程中不需要当前场景数据集的训练数据必须具有标注信息,因此使得发明在实际应用中更为方便。
-
公开(公告)号:CN103002284B
公开(公告)日:2016-06-08
申请号:CN201210470731.3
申请日:2012-11-20
Applicant: 北京大学
IPC: H04N19/179
Abstract: 本发明提出了一种基于场景模型自适应更新的视频编解码方法。该方法首先计算出场景图像更新前若干帧,场景图像更新后若干帧,以及场景图像之间的码流大小关系,并以此作为依据来判断在当前位置上是否需要更新场景。然后,对于更新的场景,可以使用已编码的场景图像对其进行预测编码,从而减小场景更新代价。以动态自适用更新的场景为基础,输入的待编码图像可以选择性适用若干场景图像或普通参考图像作为参考图像进行预测编码。对应的,在解码过程中,首先解码场景更新标识,然后根据解码出的场景更新标识对场景图像进行解码,再根据解码出来的场景图像,对视频图像进行解码。
-
公开(公告)号:CN103577829B
公开(公告)日:2016-04-20
申请号:CN201310552751.X
申请日:2013-11-08
Abstract: 本发明公开了一种车标定位方法和装置,属于计算机图像处理领域,该方法包括:根据先验知识确定车标所在的大致区域,并提取轮廓图;对轮廓图进行自适应分割,得到最优连通区分割;筛选出分割所得区域中为车标的区域,提取出车标图像。本发明实施例的方法和装置,采用自适应的连通区分割来定位车标,能提高车标定位的准确率。此外,通过定义车标似然度来进一步精定位车标,能更有效提高车标的定位准确率。
-
公开(公告)号:CN102750731B
公开(公告)日:2016-03-23
申请号:CN201210231834.4
申请日:2012-07-05
Applicant: 北京大学
IPC: G06T17/00
Abstract: 本发明涉及一种基于左右单眼感受野和双目融合的立体视觉显著计算方法,属于计算机视觉技术领域。通过模拟人类立体视觉系统处理过程,首先分别建立左右单眼感受野模型获取对应的特征图,然后融合同特征下左右眼的特征图和不同特征的结果图,并基于中心偏爱和前景偏爱调整像素显著度,最终得到最接近人类立体视觉注意的显著度分布图。本发明创新点在于:加入了“中心偏爱”和“前景偏爱”两种常见现象对人类立体视觉注意的影响,使得整个方法能够更好的符合人类视觉系统处理过程。本发明提供的立体视觉显著计算方法,能够更好的模拟人类立体视觉系统处理过程,并更有效地提取立体图像中感兴趣区域。
-
公开(公告)号:CN104899872A
公开(公告)日:2015-09-09
申请号:CN201510253424.3
申请日:2015-05-18
Applicant: 北京大学
IPC: G06T7/00
CPC classification number: G06T7/0002
Abstract: 本发明实施例提供了一种基于显式和隐含信息的图像视觉显著度计算方法和装置。该方法主要包括:从图像中提取视觉词汇,建立任意两个视觉词汇之间的隐含关系模型;根据所述隐含关系模型获取所述图像上任意两个宏块之间的隐含关系系数,在不同颜色通道上分别提取每个宏块的显式显著度;根据所述图像上任意两个宏块之间的隐含关系系数和每个宏块的显式显著度建立图模型,根据所述图模型计算出所述图像的视觉显著度。本发明实施例可以使用这种先验知识和图像的显式信息量来构建有向图,用有向图的随机游走结果来计算显著度能得到更干净、准确、稀疏的图像的视觉显著度,可以有效地区分图像中的目标和干扰物,更好地定位图像中的重要内容。
-
公开(公告)号:CN104363454A
公开(公告)日:2015-02-18
申请号:CN201410440632.X
申请日:2014-09-01
Applicant: 北京大学
IPC: H04N19/30 , H04N19/146 , H04N19/503 , H04N19/593
Abstract: 本发明提供一种高码率图像的视频编、解码方法及系统,编码方法的步骤是编码端首先对原始的高码率图像编码得到其重建图像,为基本层的基本图像,然后根据原始的高码率图像和基本图像得到残差层的残差图像,对残差图像编码得到残差图像的重建图像,根据基本图像和残差图像的重建图像得到高码率图像的重建图像;解码方法的步骤是解码端首先根据接收到的码流信息进行解码,生成解码标志位,进而根据解码标志位判断当前码流属于基本层或者残差层,得到高码率图像的重建图像。本发明通过将高码率图像分为不同层次进行传输,有效解决了视频传输过程中某个时刻瞬时码率过高引起的传输延迟或者缓冲器溢出。
-
公开(公告)号:CN104268594A
公开(公告)日:2015-01-07
申请号:CN201410493959.3
申请日:2014-09-24
IPC: G06K9/66
CPC classification number: G06K9/00771 , G06K9/6244 , G06K9/6255 , G06K9/6296 , G06K9/00711 , G06K9/6256 , G06K2009/00738
Abstract: 本发明提供一种视频异常事件检测方法和装置,所述方法包括:提取包含多帧图像的待检测视频流的高层次表示信息,该高层次表示信息中包含所述待检测视频流的时空信息;通过预置的字典,计算用所述字典中的最少数目的基表征所述待检测视频流的高层次表示信息时的重构系数;根据所述重构系数计算重构代价值;当所述重构代价值大于预设阈值时,确定所述待检测视频流中存在异常事件;当所述重构代价值小于或等于预设阈值时,确定所述待检测视频流中不存在异常事件。本发明提供的方法特征表达能力强,能够很好的描述异常事件,提高视频异常事件检测的效率和准确性。
-
公开(公告)号:CN103916666A
公开(公告)日:2014-07-09
申请号:CN201310008086.8
申请日:2013-01-09
Applicant: 北京大学
IPC: H04N19/15 , H04N19/184 , H04N19/30
Abstract: 本发明提供了一种视频编码方法、解码方法、编码器及解码器,获取当前图像和当前图像的序号,根据该序号和预设的图像层次结构,确定当前图像所处的图像层次,并生成当前图像的层次标识,其中,预设的图像层次结构包括图像层次间的参考关系和各图像层次的构成,当前图像的层次标识用于标识与当前图像对应的参考图像缓冲区的目标管理方式,参考参考图像缓冲区中的参考图像,对当前图像进行编码,得到当前图像的编码比特流,该编码比特流包括该层次标识,根据该层次标识所标识的目标管理方式,对参考图像缓冲区进行管理。本发明通过预设的图像层次结构,对参考图像缓冲区进行管理,以较少缓存单元个数实现图像间灵活的参考关系,提高视频编解码性能。
-
公开(公告)号:CN103903229A
公开(公告)日:2014-07-02
申请号:CN201410093837.5
申请日:2014-03-13
IPC: G06T5/00
Abstract: 本发明公开了一种夜晚图像增强方法和装置,属于图像处理技术领域。该方法包括:对输入的夜晚图像进行本征图像分解,得到亮度图像和反射图像;基于亮度指数衰减模型对亮度图像进行增强;对增强的亮度图像进行优化;利用反射图像和优化后的亮度图像合成输出增强图像。采用本发明实施例的方法和装置,不需要背景图像作为参考图像,就能根据输入的夜晚图像输出符合亮度衰减物理过程、降低噪声和颜色偏差的增强图像。
-
公开(公告)号:CN103729620A
公开(公告)日:2014-04-16
申请号:CN201310680608.9
申请日:2013-12-12
Applicant: 北京大学
Abstract: 本发明提出了一种基于视角贝叶斯网络模型的行人检测方法及装置,可以对多个摄像头监控的人群比较密集的场景进行行人检测和定位。不仅适用于前景提取效果较好的场景,也适用于前景提取效果不佳但可以通过行人检测器进行检测的场景。本发明的方法包括单视处理步骤、基平面映射步骤、多视角融合步骤和逆映射以及最终检测结果输出步骤。
-
-
-
-
-
-
-
-
-