使用非固定参考场前向预测跳过模式的编码解码方法

    公开(公告)号:CN102547292B

    公开(公告)日:2018-07-06

    申请号:CN201210033977.4

    申请日:2012-02-15

    Abstract: 本发明公开了一种使用非固定参考场前向预测跳过模式的编码解码方法。所述编码方法包括:以场编码方式编码隔行扫描序列前向预测图像时,图像头中添加前向预测跳过模式参考索引标记;跟据前向参考跳过模式参考索引标记的值,确定所述前向预测图像中前向预测跳过模式便用的参考场。所述解码方法在解码以场编码方式编码的隔行扫描序列的前向预测图像时,先解码得到前向预测跳过模式参考索引标记;跟据前向预测跳过模式参考索引标记的值,确定所述前向预测图像中前向预测跳过模式的宏块使用的参考场。

    一种基于卷积神经网络的视频动作检测方法

    公开(公告)号:CN106897714A

    公开(公告)日:2017-06-27

    申请号:CN201710177579.2

    申请日:2017-03-23

    Abstract: 本发明公布了一种视频动作检测方法,涉及计算机视觉识别技术领域。本发明视频动作检测方法基于卷积神经网络,通过在网络结构中增加时空金字塔池化层,消除网络对输入的限制,加快训练和检测的速度,提高视频动作分类和时间定位的性能;卷积神经网络包括卷积层、普通池化层、时空金字塔池化层和全连接层;卷积神经网络的输出包括类别分类输出层和时间定位计算结果输出层;本发明方法不需要通过下采样来获取不同时间长度的视频片段,而是直接一次输入整个视频,提高了效率;同时,由于网络训练的是同一频率的视频片段,并无增加类内的差异性,降低了网络的学习负担,模型收敛得更快,检测效果更好。

    基于主视点的全景视频映射方法

    公开(公告)号:CN106846245A

    公开(公告)日:2017-06-13

    申请号:CN201710031017.7

    申请日:2017-01-17

    CPC classification number: G06T3/0031 G06T3/005 G06T3/0075

    Abstract: 本发明公布了全景视频正映射方法和全景视频反映射方法,涉及虚拟现实(VR)视频领域。本发明中,正映射方法基于主视点,将球面上的区域I、II、III分别映射到平面上相应的区域,其中区域I对应夹角0°~Z1的区域,区域II对应夹角Z1~Z2的区域,区域III对应夹角Z2~180°的区域。全景视频正映射方法将全景图像A所对应的球面映射到平面方形图像B上;全景视频反映射方法将平面方形图像B映射回球面,进行渲染播放。本发明可大大降低视频的分辨率,有效地降低全景视频编码的码率和编解码的复杂度,达到减少编码码率并保证ROI区域的视频质量的目的。

    全景视频感兴趣区域的描述方法和编码方法

    公开(公告)号:CN106412582A

    公开(公告)日:2017-02-15

    申请号:CN201610945845.7

    申请日:2016-10-26

    CPC classification number: H04N19/146 H04N19/167

    Abstract: 本发明公布了一种基于球面多层圆周的全景视频感兴趣区域的描述方法和编码方法,对全景视频多层感兴趣区域进行描述,首先设定为全景视频感兴趣区域的中心;再设定感兴趣区域的层数为N;通过半径或夹角获得当前层感兴趣区域的大小Rn;全部获取N层感兴趣区域的大小,将感兴趣区域的中心、层数、每一层的大小等信息写入码流的序列头。编码方法通过使用QP调整值对初始QP进行调整或进行滤波,再对图像进行编码。本发明技术方案可对全景视频多层感兴趣区域进行灵活的码率分配;在保证感兴趣区域具有较高的图像质量的同时,本发明技术方案能够大幅度降低编码和传输所需的码率。

    基于加权量化的视频压缩编解码方法及编解码器

    公开(公告)号:CN103716623B

    公开(公告)日:2017-02-15

    申请号:CN201310695685.1

    申请日:2013-12-17

    Abstract: 本申请公开一种基于加权量化的视频压缩编解码方法,编码过程包括将待编码图像的属性分量划分成若干属性块;对属性块进行预测得到残差块,并变换得到残差块中各频点的变换系数;选取一个默认矩阵,对频点的初始量化步长进行加权计算得到加权量化步长矩阵;使用加权量化步长矩阵对变换系数进行量化,得到量化块,将量化块写入码流,并根据量化块的值,确认写入码流的其他信息。本申请还公开一种基于加权量化的视频压缩编解码器。本申请由于预设加权量化矩阵集中包括多个默认矩阵,能有效地对不同情况下的变换系数矩阵进行加权量化,在不降低主观质量的情况下,有效的降低编码所需码率。

    一种跨媒体检索方法
    127.
    发明公开

    公开(公告)号:CN106095893A

    公开(公告)日:2016-11-09

    申请号:CN201610398342.2

    申请日:2016-06-06

    CPC classification number: G06F17/30 G06F17/30023

    Abstract: 本发明公布了一种跨媒体数据检索方法,通过基于耦合的特征映射、同种媒体内和不同媒体间的关联挖掘进行跨媒体检索,包括:建立多媒体数据集、对样本集中的所有样本进行耦合特征映射、进行同种媒体类型内的关联挖掘、进行异种媒体类型间的关联挖掘、通过两种关联挖掘方法得到待检索图像或待检索文本的类别概率矩阵进行加权,分别得到图像检索文本的类别相似度矩阵和文本检索图像的类别相似度矩阵、将相似度降序排列进行检索。本发明提供的技术方案整体性能较好、适用性较广,可以用在多种跨媒体检索场景中。

    图像去模糊方法及系统
    128.
    发明公开

    公开(公告)号:CN105493140A

    公开(公告)日:2016-04-13

    申请号:CN201580000103.0

    申请日:2015-05-15

    CPC classification number: G06T5/003 G06K9/4671 G06T5/00 G06T7/11 G06T7/13

    Abstract: 一种图像去模糊方法,包括:估算中间图像L:标记输入图像的边缘区域和平滑区域,分别对边缘区域和平滑区域进行约束,获得中间图像L;估算模糊核k:提取中间图像L的显著边缘,显著边缘为边缘尺度大于模糊核的尺度的边缘,利用显著边缘计算模糊核k;复原输入图像:根据输入图像和估算模糊核k进行非盲反卷积,将输入图像复原成清晰图像。由于对边缘区域和平滑区域进行约束,使得获得的中间图像即能够保留边缘又能有效去除平滑区域的噪声和振铃效应,并利用中间图像L的显著边缘计算模糊核,使得模糊核的估算更加准确,最后,根据输入图像和估算的模糊核k进行非盲反卷积,将输入图像复原成清晰图像,达到了很好的去模糊效果。

    一种基于字典匹配的图像超分辨率重建方法及装置

    公开(公告)号:CN105389778A

    公开(公告)日:2016-03-09

    申请号:CN201510741060.3

    申请日:2015-11-04

    CPC classification number: G06T3/4053

    Abstract: 本申请还提供一种基于字典匹配的图像超分辨率重建方法及装置,建立匹配字典库,将待重建图像输入多层线滤波器网络,提取待重建图像的局部特征,从匹配字典库中寻找与所述待重建图像的局部特征相似度最高的低分辨率图像块的局部特征,寻找在匹配字典库中,所述相似度最高的低分辨率图像块的局部特征所在联合样本的残差值,对相似度最高的低分辨率图像块的局部特征进行插值放大,加上残差值,获得重建后的高分辨率图像块。经过多层线滤波器网络提取的待重建图像的局部特征,精度更高,因此在后续与匹配字典库匹配时,匹配度更高,因而重建出的图像质量也跟好。因而,本申请可以大大提升重建的高分辨率图像的质量。

    视频解码方法及解码器
    130.
    发明公开

    公开(公告)号:CN105264887A

    公开(公告)日:2016-01-20

    申请号:CN201380000787.5

    申请日:2013-06-27

    CPC classification number: H04N19/436 H04N19/44 H04N19/91

    Abstract: 本申请公开了一种视频解码方法及解码器,熵解码模块对输入的图像帧所对应的码流进行熵解码,同时,熵解码模块根据重建模块的空闲状态信息,将熵解码所得行数据按预定顺序逐个分发至空闲的重建模块;重建模块根据接收到的行数据,对图像帧中的行进行重建。这样,熵解码模块在进行图像帧中一行的熵解码的同时,重建模块可对上一行进行重建,提高了视频解码效率,提高了视频并行解码性能;重建模块之间也能够并行执行图像帧中行的重建,进一步提高了视频解码效率,进一步提高了视频并行解码性能。

Patent Agency Ranking