一种高码率图像的视频编、解码方法及系统

    公开(公告)号:CN104363454A

    公开(公告)日:2015-02-18

    申请号:CN201410440632.X

    申请日:2014-09-01

    Applicant: 北京大学

    Abstract: 本发明提供一种高码率图像的视频编、解码方法及系统,编码方法的步骤是编码端首先对原始的高码率图像编码得到其重建图像,为基本层的基本图像,然后根据原始的高码率图像和基本图像得到残差层的残差图像,对残差图像编码得到残差图像的重建图像,根据基本图像和残差图像的重建图像得到高码率图像的重建图像;解码方法的步骤是解码端首先根据接收到的码流信息进行解码,生成解码标志位,进而根据解码标志位判断当前码流属于基本层或者残差层,得到高码率图像的重建图像。本发明通过将高码率图像分为不同层次进行传输,有效解决了视频传输过程中某个时刻瞬时码率过高引起的传输延迟或者缓冲器溢出。

    一种视频异常事件检测方法及装置

    公开(公告)号:CN104268594A

    公开(公告)日:2015-01-07

    申请号:CN201410493959.3

    申请日:2014-09-24

    Abstract: 本发明提供一种视频异常事件检测方法和装置,所述方法包括:提取包含多帧图像的待检测视频流的高层次表示信息,该高层次表示信息中包含所述待检测视频流的时空信息;通过预置的字典,计算用所述字典中的最少数目的基表征所述待检测视频流的高层次表示信息时的重构系数;根据所述重构系数计算重构代价值;当所述重构代价值大于预设阈值时,确定所述待检测视频流中存在异常事件;当所述重构代价值小于或等于预设阈值时,确定所述待检测视频流中不存在异常事件。本发明提供的方法特征表达能力强,能够很好的描述异常事件,提高视频异常事件检测的效率和准确性。

    一种夜晚图像增强方法和装置

    公开(公告)号:CN103903229A

    公开(公告)日:2014-07-02

    申请号:CN201410093837.5

    申请日:2014-03-13

    Abstract: 本发明公开了一种夜晚图像增强方法和装置,属于图像处理技术领域。该方法包括:对输入的夜晚图像进行本征图像分解,得到亮度图像和反射图像;基于亮度指数衰减模型对亮度图像进行增强;对增强的亮度图像进行优化;利用反射图像和优化后的亮度图像合成输出增强图像。采用本发明实施例的方法和装置,不需要背景图像作为参考图像,就能根据输入的夜晚图像输出符合亮度衰减物理过程、降低噪声和颜色偏差的增强图像。

    一种基于多视角贝叶斯网络的多视角行人检测方法

    公开(公告)号:CN103729620A

    公开(公告)日:2014-04-16

    申请号:CN201310680608.9

    申请日:2013-12-12

    Applicant: 北京大学

    Abstract: 本发明提出了一种基于视角贝叶斯网络模型的行人检测方法及装置,可以对多个摄像头监控的人群比较密集的场景进行行人检测和定位。不仅适用于前景提取效果较好的场景,也适用于前景提取效果不佳但可以通过行人检测器进行检测的场景。本发明的方法包括单视处理步骤、基平面映射步骤、多视角融合步骤和逆映射以及最终检测结果输出步骤。

    一种监控摄像机测距方法及装置

    公开(公告)号:CN103578109A

    公开(公告)日:2014-02-12

    申请号:CN201310552823.0

    申请日:2013-11-08

    Abstract: 本发明公开了一种监控摄像机测距方法和装置,属于智能监控技术领域,该方法包括:通过标定工具的不同摆放位置获取不同的世界坐标系和每个世界坐标系里的标定点;获取每个世界坐标系的标定点在世界坐标系中的位置和在图像坐标系中的位置;根据标定点在世界坐标系中的位置和在图像坐标系中的位置计算出不同世界坐标系下的摄像机参数;选取对测距点合适的世界坐标系对应的摄像机参数,将测距点从图像坐标系投影到世界坐标系中,计算测距点之间的真实距离。本发明降低了由于标定范围广、人工标定操作带来的误差对摄像机参数的计算产生的较大影响,提高了测距的准确性,适合于监控视野比较宽广的监控摄像头的参数标定和测距。

    分布式训练方法、装置、智能终端及计算机可读存储介质

    公开(公告)号:CN114035938B

    公开(公告)日:2025-02-07

    申请号:CN202111209507.4

    申请日:2021-10-18

    Abstract: 本发明公开了分布式训练方法、装置、智能终端及计算机可读存储介质,方法包括:分别获取各服务器的服务器智能水平,各上述服务器智能水平分别体现对应服务器的数据处理能力;基于待训练数据集的复杂度、待训练模型的复杂度以及各服务器智能水平获取目标分组数目信息,并基于目标分组数目信息和各上述服务器的服务器智能水平对所有服务器进行群组划分,获取多个服务器群组;基于各服务器群组的群组智能水平分别为各服务器群组分发待训练数据集中的数据资源和待训练模型中的模型资源,各群组智能水平分别体现对应服务器群组的数据处理能力;分别控制各服务器群组基于获得的数据资源和模型资源进行训练。与现有技术中相比,本发明可提高训练效率。

    大规模多机多卡预训练方法、系统、设备及服务器集群

    公开(公告)号:CN113723552B

    公开(公告)日:2024-11-08

    申请号:CN202111042840.0

    申请日:2021-09-07

    Abstract: 本发明属于分布式训练技术领域,公开了一种大规模多机多卡预训练方法、系统、设备及服务器集群,在多个服务器上部署多机多卡,进行同构机型和异构混合机型的多机多卡并行;基于slurm框架进行大规模多机多卡训练及评测,以无监督特征学习BYOL算法为例予以实施;基于Horovod框架进行大规模多机多卡训练及评测,以视频语义无监督学习PRP算法予以实施;所述训练包括环境配置、任务配置、通信配置、任务加速。本发明涉及的多机多卡大规模训练实验,batchsize之高,训练时间压缩之短,验证鹏城云脑I大科学装置的并行能力,拓展并行训练的集群规模,对于利用超大规模集群开展分布式训练具有指导意义。

    分布式训练方法、装置、智能终端及计算机可读存储介质

    公开(公告)号:CN114035938A

    公开(公告)日:2022-02-11

    申请号:CN202111209507.4

    申请日:2021-10-18

    Abstract: 本发明公开了分布式训练方法、装置、智能终端及计算机可读存储介质,方法包括:分别获取各服务器的服务器智能水平,各上述服务器智能水平分别体现对应服务器的数据处理能力;基于待训练数据集的复杂度、待训练模型的复杂度以及各服务器智能水平获取目标分组数目信息,并基于目标分组数目信息和各上述服务器的服务器智能水平对所有服务器进行群组划分,获取多个服务器群组;基于各服务器群组的群组智能水平分别为各服务器群组分发待训练数据集中的数据资源和待训练模型中的模型资源,各群组智能水平分别体现对应服务器群组的数据处理能力;分别控制各服务器群组基于获得的数据资源和模型资源进行训练。与现有技术中相比,本发明可提高训练效率。

    神经网络表示标准框架结构

    公开(公告)号:CN108985448B

    公开(公告)日:2020-11-17

    申请号:CN201810575097.7

    申请日:2018-06-06

    Applicant: 北京大学

    Abstract: 本发明提供一种神经网络表示标准框架结构,包括:可互操作表示模块,通过对输入的神经网络进行转换得到可互操作的表示格式,其包含对神经网络的语法定义、支持的运算操作定义和权重格式定义;紧凑表示模块,将可互操作表示的神经网络通过神经网络压缩算法转换为序列化格式,其包含压缩后的神经网络的语法定义、支持的运算操作定义和权重格式定义;编解码表示模块,通过神经网络压缩算法将紧凑表示的神经网络转换为编解码表示,其包含压缩后的神经网络的语法定义、支持的运算操作定义和编解码后权重格式定义;封装表示模块,将安全信息和身份认证信息和神经网络一起封装,由此将神经网络转换为模型。

    一种基于脉冲信号的显示方法和系统

    公开(公告)号:CN109803096B

    公开(公告)日:2020-08-25

    申请号:CN201910027914.X

    申请日:2019-01-11

    Applicant: 北京大学

    Abstract: 本申请公开了一种基于脉冲信号的显示方法和系统,包括:分析单个像素位置对应的脉冲序列,脉冲发放信息;获取单个脉冲发放时间之前的多个脉冲发放时间所对应的各像素值,将其累加作为第一累加像素值;与所述像素位置的所述单个脉冲发放时间相对应地设定第一特定量,叠加第一特定量与第一累加像素值,得到所述像素位置的第一像素值;比较第一像素值与像素阈值范围的关系,调整第一特定量得到第二特定量;叠加第一累加像素值与第二特定量得到所述像素位置的第二像素值,使用各第二像素值生成图像。通过利用脉冲信号的时域特性计算像素值,构成高质量的图像并输出任意连续时刻的图像;根据像素阈值范围调整像素值,提高生成图像的质量。

Patent Agency Ranking