-
公开(公告)号:CN103903229B
公开(公告)日:2017-01-04
申请号:CN201410093837.5
申请日:2014-03-13
IPC: G06T5/00
Abstract: 本发明公开了一种夜晚图像增强方法和装置,属于图像处理技术领域。该方法包括:对输入的夜晚图像进行本征图像分解,得到亮度图像和反射图像;基于亮度指数衰减模型对亮度图像进行增强;对增强的亮度图像进行优化;利用反射图像和优化后的亮度图像合成输出增强图像。采用本发明实施例的方法和装置,不需要背景图像作为参考图像,就能根据输入的夜晚图像输出符合亮度衰减物理过程、降低噪声和颜色偏差的增强图像。
-
公开(公告)号:CN103500456B
公开(公告)日:2016-06-15
申请号:CN201310499912.3
申请日:2013-10-22
Applicant: 北京大学
IPC: G06T7/20
Abstract: 本发明公开了一种基于动态贝叶斯网络的对象跟踪方法,该方法包括:对输入的图像帧进行预处理,对图像帧进行对象检测或者前景检测,得到对象检测结果,根据对象检测结果,针对需要跟踪的新对象初始化对象跟踪器,并将其添加到对象跟踪器序列中;根据对象跟踪序列中每个对象的位置提取其在当前帧的各种状态的多种表观特征,将对象关联的检测结果和各种状态的多种表观特征加入到动态贝叶斯网络中进行分析处理,最终推理出每个对象在当前帧的最优位置并更新对象跟踪序列。本发明通过引入适合对象跟踪的动态贝叶斯网络,有效的克服了对象之前相互遮挡对跟踪性能的影响,提高了对象跟踪的召回率和跟踪精度。
-
公开(公告)号:CN103578109B
公开(公告)日:2016-04-20
申请号:CN201310552823.0
申请日:2013-11-08
Abstract: 本发明公开了一种监控摄像机测距方法和装置,属于智能监控技术领域,该方法包括:通过标定工具的不同摆放位置获取不同的世界坐标系和每个世界坐标系里的标定点;获取每个世界坐标系的标定点在世界坐标系中的位置和在图像坐标系中的位置;根据标定点在世界坐标系中的位置和在图像坐标系中的位置计算出不同世界坐标系下的摄像机参数;选取对测距点合适的世界坐标系对应的摄像机参数,将测距点从图像坐标系投影到世界坐标系中,计算测距点之间的真实距离。本发明降低了由于标定范围广、人工标定操作带来的误差对摄像机参数的计算产生的较大影响,提高了测距的准确性,适合于监控视野比较宽广的监控摄像头的参数标定和测距。
-
公开(公告)号:CN103020628B
公开(公告)日:2016-02-24
申请号:CN201210506158.7
申请日:2012-11-30
Abstract: 本发明公开了一种基于RGB对比图像与目标形状的视频烟雾检测方法,其方法包括以下步骤:(1)对输入视频图像进行预处理,并且得到背景帧与前景区域;(2)获得背景帧和当前帧的RGB对比图像,并对其进行二维离散小波变换,得到小波系数图像;(3)从获取的小波系数图像上提取可疑区域的能量特征;(4)提取可疑区域的视觉特征;(5)综合考虑能量特征与视觉特征对可疑区域是否为烟雾区域做出判定。该方法对获取的RGB对比图像进行二维离散小波变化,使得在小波变换中能很好的区分烟雾和一般纯色物体,并且在考虑能量特征时,把可疑区域的形状和可疑区域内高低频的能量比进行综合考虑从而使得检测结果更具有可靠性。
-
公开(公告)号:CN103813169A
公开(公告)日:2014-05-21
申请号:CN201410056434.3
申请日:2014-02-19
Applicant: 北京大学
IPC: H04N19/20 , H04N19/136
Abstract: 本发明提出了一种视频编解码器中可伸缩的对象表示方法,本方法在编码过程中,根据编码单元的划分结构和对象信息来判定编码单元的对象属性,从而将对象属性编入输出视频的比特流;在解码过程中,解码出对象属性,从而得到包括形状、位置的对象信息。利用此方法,本发明提出视频编解码器中可伸缩的对象表示装置。对于一个最大编码单元,根据模式决策对其进行递归划分;对于终止划分的编码单元,判断其是否属于对象:不属于对象则进入标识编码模块为其编码对象索引标识;属于对象则进入对象表示精度决策模块。
-
公开(公告)号:CN103810505A
公开(公告)日:2014-05-21
申请号:CN201410055852.0
申请日:2014-02-19
Applicant: 北京大学
Abstract: 本发明公开了一种基于多层描述子的车辆标识方法与系统。其方法包括以下步骤:(1)车辆全局特征提取;(2)车辆奇异区域提取特征提取;(3)多层描述子构造;(4)基于多层描述子的车辆标识,在综合考虑匹配精度与匹配速度的情况下,利用多种匹配策略获得最终车辆标识的结果。本发明并在所述方法的基础上,开发了基于多层特征的车辆标识系统;并且在该系统的基础架构上,还发明了一些具体的车辆标识的系统。本发明的车辆标识方法运用多层描述子对车辆进行描述,并且利用多种匹配策略来保证多层描述子之间的匹配精度与匹配速度,使得该方法能在不同领域的车辆标识运用中取得较好的效果。
-
公开(公告)号:CN103500456A
公开(公告)日:2014-01-08
申请号:CN201310499912.3
申请日:2013-10-22
Applicant: 北京大学
IPC: G06T7/20
Abstract: 本发明公开了一种基于动态贝叶斯网络的对象跟踪方法,该方法包括:对输入的图像帧进行预处理,对图像帧进行对象检测或者前景检测,得到对象检测结果,根据对象检测结果,针对需要跟踪的新对象初始化对象跟踪器,并将其添加到对象跟踪器序列中;根据对象跟踪序列中每个对象的位置提取其在当前帧的各种状态的多种表观特征,将对象关联的检测结果和各种状态的多种表观特征加入到动态贝叶斯网络中进行分析处理,最终推理出每个对象在当前帧的最优位置并更新对象跟踪序列。本发明通过引入适合对象跟踪的动态贝叶斯网络,有效的克服了对象之前相互遮挡对跟踪性能的影响,提高了对象跟踪的召回率和跟踪精度。
-
公开(公告)号:CN113723443B
公开(公告)日:2025-04-11
申请号:CN202110784131.3
申请日:2021-07-12
Applicant: 鹏城实验室 , 北京大学深圳研究生院
IPC: G06V10/82 , G06V10/764 , G06V10/774 , G06V10/776 , G06V10/94 , G06V10/96 , G06N3/0464 , G06N3/084 , G06T1/20 , G06F3/06 , H04L67/1097 , H04L67/568 , H04L67/1095
Abstract: 本发明公开了一种视觉大模型分布式训练方法及系统,所述方法包括:构建分布式训练系统,包括主控服务器、多个GPU服务器、分布式存储服务器和存储网络交换机;根据视觉大模型训练所用数据集的大小,确定数据加载方式;根据所述视觉大模型的结构特点,对所述视觉大模型中不同类型的网络层组的参数量和计算量进行评估,结合GPU的算力和缓存能力对所述视觉大模型进行分解,确定所述视觉大模型的并行训练方案;采用混合并行模式进行模型训练,基于所述主控服务器进行模型聚合、全局模型更新和模型分发,在训练过程中每隔若干周期利用训练集和验证集对所述视觉大模型进行测评,当所述视觉大模型收敛后停止训练;本发明实现了视觉大模型的高效训练。
-
公开(公告)号:CN109919183B
公开(公告)日:2020-12-18
申请号:CN201910069271.5
申请日:2019-01-24
Applicant: 北京大学
IPC: G06K9/62
Abstract: 本发明公开了一种基于小样本的图像识别方法、装置、设备及存储介质,属于图像识别技术领域。所述方法包括:根据第一大样本图像集构建小样本的第一任务序列,每个第一任务包括带类别标签的第一支持集和不带类别标签的第一检索集;采用神经网络提取第一支持集中各图像样本的第一样本特征;根据第一样本特征和样本的类别标签,自适应地学习相应第一任务的度量矩阵;采用度量矩阵对相应第一检索集中的图像样本进行识别。该方法中,提高了小样本场景下的图像识别性能和准确率。
-
公开(公告)号:CN109831672B
公开(公告)日:2020-10-27
申请号:CN201910020716.0
申请日:2019-01-09
Applicant: 北京大学
IPC: H04N19/51 , H04N19/513 , H04N19/169 , H04N19/56 , H04N19/557 , H04N19/527 , H04N19/567 , H04N19/96
Abstract: 本发明提供了一种时空脉冲阵列的运动估计方法,该方法包括以下步骤:将所述时空脉冲阵列划分成编码立方体;依据当前编码立方体的特征信息,确定时域和空域的搜索范围及搜索起始点;将所述时空脉冲阵列内的所有脉冲信号在空间平面投影,再进行距离度量和匹配分析;通过当前编码立方体与参考立方体的匹配阈值判断是否提前终止搜索,若小于阈值则提前终止所述搜索,否则继续搜索直至超出搜索范围;筛选最佳参考立方体;输出时空脉冲阵列的运动估计编码信息。本发明可有效地获取高精度的运动矢量,同时加速了运动估计搜索过程,以解决时空脉冲阵列编码信号中运动估计的编码性能局限及时间耗时长的问题。
-
-
-
-
-
-
-
-
-