一种用于行人检测的协同式深度网络模型方法

    公开(公告)号:CN106650806B

    公开(公告)日:2019-07-26

    申请号:CN201611166903.2

    申请日:2016-12-16

    CPC classification number: G06K9/00362 G06K9/6223 G06K9/6269 G06N3/0454

    Abstract: 本发明公布了一种用于行人检测的协同式深度网络模型方法,包括:构建一种新的协同式多模型学习框架来完成行人检测中的分类过程;利用人工神经元网络来整合协同式模型中各子分类器的判决结果,并借用机器学习的方法训练该网络,能够更加有效地综合各分类器反馈的信息;提出一种基于K‑means聚类算法的重采样方法,增强协同模型中各分类器的分类效果,进而提升整体分类效果。本发明通过建立协同式深度网络模型,将由聚类算法得到的不同类型的训练数据集用于并行地训练多个深度网络模型,再通过人工神经元网络将原始数据集在各个深度网络模型上的分类结果进行整合和综合分析,以实现更加精准的样本分类。

    基于迭代投影重建的字典类图像超分辨率系统及方法

    公开(公告)号:CN105023240B

    公开(公告)日:2019-07-09

    申请号:CN201510398331.X

    申请日:2015-07-08

    CPC classification number: G06T3/00

    Abstract: 本发明提供一种基于迭代投影重建的字典类图像超分辨率系统及方法,所述系统包括:字典训练和投影矩阵预计算模块、基于投影矩阵的迭代投影超分辨率重建模块和基于全局约束的后处理模块。所述方法包括:步骤S1、字典的学习和投影矩阵的计算;步骤S2、基于投影矩阵的迭代投影超分辨率重建:对低分辨率图像块输入y,在字典中寻找与其最相似的原子,使用该原子的投影矩阵来对y进行超分辨率重建,对产生的残差向量进行再次投影重建获得残差向量的高分辨率重建,如此迭代重建,最后将全部重建成分加权相加作为最后重建的结果;步骤S3、对重建图像通过全局约束来消除不自然效应。本发明可有效提高字典类方法的计算速度并能够恢复图像高频细节信息。

    一种基于多角度自适应帧内预测的点云属性压缩方法

    公开(公告)号:CN108632607B

    公开(公告)日:2019-06-21

    申请号:CN201810435402.2

    申请日:2018-05-09

    Abstract: 本发明公布了一种基于多角度自适应帧内预测的点云属性压缩方法,针对点云属性信息,提出一种新的基于块结构的帧内预测方案,提供六种预测模式以尽可能地减少点云不同编码块之间的信息冗余,提高点云属性的压缩性能;包括:(1)点云的输入;(2)点云属性的颜色空间转换;(3)采用K‑dimension(KD)树划分点云得到编码块;(4)基于块结构的多角度自适应帧内预测;(5)帧内预测模式决策;(6)变换、均匀量化和熵编码。本发明使用KD树对点云进行编码块的划分,并按照广度优先遍历的顺序对编码块进行编号,根据编号顺序使用具有六种预测模式的点云帧内预测方案对编码块进行逐一处理,由模式决策选出最佳预测模式,再对预测残差进行变换、量化和熵编码处理,以达到点云属性压缩的最佳性能。

    一种反量化方法、系统、设备及计算机可读介质

    公开(公告)号:CN109788289A

    公开(公告)日:2019-05-21

    申请号:CN201910141289.1

    申请日:2019-02-26

    Abstract: 本申请公开了一种反量化方法、系统、设备及计算机可读介质。本申请实施例的方法包括:确定初始加权反量化矩阵,所述初始加权反量化矩阵与量化块的尺寸一致;对所述初始加权反量化矩阵中的多个矩阵元素进行置零操作,获取加权反量化矩阵,其中,根据所述量化块的尺寸确定需要进行置零操作的矩阵元素;对所述量化块中的量化系数进行加权反量化,生成对应的反变换系数,其中,使用所述加权反量化矩阵中与所述量化系数位置对应的矩阵元素的值作为所述加权反量化的权重系数。相较于现有技术,根据本发明实施例的反量化方法通过控制加权反量化矩阵的非0系数分布,将反量化后得到的反变换块中的非0系数控制在合适区域,从而控制反变换块的复杂程度。

    一种量化系数结束标志位的上下文模型选取方法及装置

    公开(公告)号:CN109788285A

    公开(公告)日:2019-05-21

    申请号:CN201910145192.8

    申请日:2019-02-27

    Abstract: 本说明书实施例提供一种量化系数结束标志位的上下文模型选取方法及装置。所述方法包括:获取当前量化系数结束标志位所对应的非零系数在特定扫描顺序下的扫描位置POS;所述扫描位置POS为所述扫描顺序下对应非零系数的下标;配置第一上下文模型数组,并以一固定值为底,计算所述扫描位置POS加1后所得到数值的对数值,根据所述对数值从所述第一上下文模型数组中选择第一上下文模型;并将所述第一上下文模型用于对所述当前量化系数结束标志位的二元符号进行编码或解码。采用本申请的技术方案,能够提升量化系数结束标志位的编解码效率,从而进一步提升视频编解码的效率。

    基于监控视频的视频前景提取方法

    公开(公告)号:CN106204636B

    公开(公告)日:2019-03-22

    申请号:CN201610478505.8

    申请日:2016-06-27

    Abstract: 本发明公布了一种针对监控视频的视频前景提取方法,基于图像块处理方法,通过调节块的大小适应不同的视频分辨率;再通过建立背景块模型,提取处于运动态的前景物体;包括:将监控视频中每一帧图像I表示为块;进行初始化;更新块背景权重、块临时背景和临时背景;更新块背景和背景;保存前景、更新前景块权重和前景块;将前景进行二值化处理即为最终前景结果。本发明针对监控视频中每一帧图像进行降维,通过基于像素的比较消除光照对于块方法的影响;同时消除监控视频尺寸不断增大对视频分析带来的影响。本发明能够提取动态前景物体、适应较大监控视频尺寸、且具有较低算法复杂度。

    一种三维网页设计方法及装置

    公开(公告)号:CN104915373B

    公开(公告)日:2018-12-07

    申请号:CN201510202663.6

    申请日:2015-04-27

    Abstract: 本申请提供的三维网页设计方法及装置,在预设的全局三维容器中为网页元素设置对应的锚点,根据对应的锚点的坐标,将网页元素在全局三维容器中进行定位,得到网页元素的定位坐标及深度值,根据定位坐标,分别在左眼视图以及右眼视图绘制所述网页元素,可以将网页元素设计成带有三维效果,因此观察者或者网页使用者在浏览网页时,即可看到三维的网页内容,提升了用户的体验度。并且网页图像上元素的需变换位置时,可以重复利用已有的锚点,因此减少了冗余计算,三维效果也仅需少量的浏览器内核变动。本申请方法适用于任何网页,适用范围大,并且本申请形成的三维界面不需要用户进行启动,设计后打开网页即可看到三维效果,使用简便。

    一种跨媒体检索方法
    69.
    发明授权

    公开(公告)号:CN106095893B

    公开(公告)日:2018-11-20

    申请号:CN201610398342.2

    申请日:2016-06-06

    Abstract: 本发明公布了一种跨媒体数据检索方法,通过基于耦合的特征映射、同种媒体内和不同媒体间的关联挖掘进行跨媒体检索,包括:建立多媒体数据集、对样本集中的所有样本进行耦合特征映射、进行同种媒体类型内的关联挖掘、进行异种媒体类型间的关联挖掘、通过两种关联挖掘方法得到待检索图像或待检索文本的类别概率矩阵进行加权,分别得到图像检索文本的类别相似度矩阵和文本检索图像的类别相似度矩阵、将相似度降序排列进行检索。本发明提供的技术方案整体性能较好、适用性较广,可以用在多种跨媒体检索场景中。

    基于时域信息的自适应视频预处理方法

    公开(公告)号:CN104994397B

    公开(公告)日:2018-11-09

    申请号:CN201510397733.8

    申请日:2015-07-08

    Abstract: 本发明公开一种基于时域信息的自适应视频预处理方法,步骤如下:步骤S1、读入一帧视频图像数据;步骤S2、获得各像素基于时域信息的加权系数;步骤S3、计算各像素的双边滤波值;步骤S4、根据加权系数和双边滤波值,让处理后的像素点的值取自于原像素及该像素双边滤波值的加权和,获得视频预处理值。本发明基于各像素的双边滤波值和加权系数处理原始图像,所获得的值为双边滤波值和原始像素值的加权和,实现了在运动估计准确以及相对静止区域保持其时域信息不变,在运动估计剧烈以及残差估计相对不准确的区域通过双边滤波实现降噪的边界保存效果,可最大程度地保留视频前后帧之间的时域相关性,并同时获得明显的码率下降和主观质量的提升。

Patent Agency Ranking