视频数据处理方法、解码设备、编码设备及存储介质

    公开(公告)号:CN113900572A

    公开(公告)日:2022-01-07

    申请号:CN202111040999.9

    申请日:2021-09-02

    Abstract: 本申请公开了一种视频数据处理方法、解码设备、编码设备及存储介质,该方法包括:接收到显示设备发送的视点生成显示指令时,获取所述显示设备的当前视点;从当前视点对应的传输路径接收到的图像帧序列的视频帧中截取所述当前视点的图像所需的图像并显示;在接收到所述显示设备发送的视点切换指令时,获取所述视点切换指令对应的目标视点,并从所述当前视点对应的传输路径接收到的所述图像帧序列的视频帧中截取生成所述目标视点的图像所需的图像并显示;在满足切换条件时,将由所述目标视点对应的传输路径接收到的图像帧序列的视频帧中截取生成所述目标视点的图像所需的图像并显示,从而提高视频画面显示效果。

    一种编码、解码变换方法、系统、设备及计算机可读介质

    公开(公告)号:CN109788286B

    公开(公告)日:2021-06-18

    申请号:CN201910105653.9

    申请日:2019-02-01

    Abstract: 本申请公开了一种编码、解码变换方法、系统、设备及计算机可读介质。本申请实施例的方法包括:使用多个变换矩阵分别对预测残差块进行变换编码,获取残差变换结果;基于所述残差变换结果,通过率失真优化决策从所述多个变换矩阵中选择与所述预测残差块的残差特性匹配的变换矩阵或变换矩阵组合,确定用于码流输出的残差变换结果。相较于现有技术,本发明实施例的方法采用与残差特性更为匹配的变换矩阵进行残差变换,从而提高了残差信号的表达效果,提升了残差块的编码效率。

    基于主视点的全景视频映射方法

    公开(公告)号:CN107622474B

    公开(公告)日:2021-03-30

    申请号:CN201710882161.1

    申请日:2017-09-26

    Abstract: 本发明公布了一种新的全景视频非对称映射方法及相应的反映射方法,通过映射方法将全景图像或视频A所对应的球面映射到二维图像或视频B上;先将球面投影到底面为方形的等腰四棱锥上,再进一步将四棱锥投影到平面上;投影中对主视点的区域使用等角投影并使用较高的采样密度,保证主视点的区域的视频质量较高,对非主视点区域使用较低的采样密度以节省码率。该全景视频非对称映射技术在保证主视点区域视频质量不变的情况下,大大降低视频其余区域的分辨率,有效地节省了虚拟现实视频编码所需的码率。全景视频非对称反映射技术提供了从平面映射回球面的方法,通过此方法可将平面视频映射回球面进行渲染观看。

    用于行人重识别的图像特征提取方法

    公开(公告)号:CN107316031B

    公开(公告)日:2020-07-10

    申请号:CN201710536020.4

    申请日:2017-07-04

    Abstract: 本发明公布了一种用于行人重识别的图像特征提取方法,通过对齐局部描述子提取和分级全局特征提取,进行行人重识别;对齐局部描述子提取采用仿射变换对原图像进行处理,对相邻区域的图像块特征进行求和池化操作而得到对齐局部描述子;对齐局部描述子保留图像内部块与块之间的空间信息;分级全局特征提取通过对定位的行人区域块进行分级,求取相应特征均值而得到全局特征。采用本发明技术方案,能够解决行人重识别中由于行人姿态变化等带来的特征不对齐问题,消除无关背景对重识别带来的影响,由此提高行人重识别的精度和鲁棒性。

    用于图像或视频中行人重识别的深度判别网络模型方法

    公开(公告)号:CN107273872B

    公开(公告)日:2020-05-05

    申请号:CN201710570245.1

    申请日:2017-07-13

    Abstract: 本发明公布了一种用于图像或视频中行人重识别的深度判别网络模型方法,通过构建深度判别网络,将不同输入图像在颜色通道上进行融合拼接,将得到的拼接结果定义为不同图像的原始差异性空间;将原始差异性空间送入卷积网络中,通过学习原始差异性空间中的差异性信息,网络输出两张输入图像之间的相似性,由此实现行人重识别。本发明不对单独的图像进行特征的学习,而是在一开始就将输入图像在颜色通道上进行融合拼接,利用设计好的网络在图像的原始空间上学习差异性信息;通过引入Inception模块,嵌入到模型之中,能够提高网络的学习能力,达到更好的判别效果。

    基于主视点的全景视频映射方法

    公开(公告)号:CN106846245B

    公开(公告)日:2019-08-02

    申请号:CN201710031017.7

    申请日:2017-01-17

    CPC classification number: G06T3/0031 G06T3/005 G06T3/0075

    Abstract: 本发明公布了全景视频正映射方法和全景视频反映射方法,涉及虚拟现实(VR)视频领域。本发明中,正映射方法基于主视点,将球面上的区域I、II、III分别映射到平面上相应的区域,其中区域I对应夹角0°~Z1的区域,区域II对应夹角Z1~Z2的区域,区域III对应夹角Z2~180°的区域。全景视频正映射方法将全景图像A所对应的球面映射到平面方形图像B上;全景视频反映射方法将平面方形图像B映射回球面,进行渲染播放。本发明可大大降低视频的分辨率,有效地降低全景视频编码的码率和编解码的复杂度,达到减少编码码率并保证ROI区域的视频质量的目的。

    一种视频帧插值方法、装置及设备

    公开(公告)号:CN109905624A

    公开(公告)日:2019-06-18

    申请号:CN201910156565.1

    申请日:2019-03-01

    Abstract: 本说明书实施例公开了一种视频帧插值方法、装置及设备。方案包括:获取视频帧训练集合,视频帧训练集合包括偶数张连续视频帧和第一关键帧,第一关键帧为偶数张连续视频帧的中间帧;构建金字塔深度学习模型,金字塔深度学习模型包括多个卷积神经网络层,各卷积神经网络层用于生成不同分辨率的中间帧;将偶数张连续视频帧输入至金字塔深度学习模型中,生成第二关键帧;根据第二关键帧和第一关键帧修正金字塔深度学习模型;然后根据修正后的金字塔深度学习模型进行视频帧插值。本发明充分地挖掘了多帧之间的时空域信息,而且采取金字塔精进策略,有效地对运动信息,遮挡区域进行估计,极大提高了中间帧的质量。

    一种量化块的解码方法、装置及电子设备

    公开(公告)号:CN109788284A

    公开(公告)日:2019-05-21

    申请号:CN201910144295.2

    申请日:2019-02-27

    Abstract: 本说明书实施例提供一种量化块的解码方法、装置及电子设备。所述方法包括:确定量化块中量化系数的扫描顺序,初始化量化系数的扫描位置,并解码一个游程长度;将当前扫描位置的下标值与游程长度的值相加得到非零系数的扫描位置,对非零系数的值进行解码;判断非零系数的下标值是否为最大下标值,当为最大下标值时,结束量化块的解码;否则,判断是否还存在未解码的非零系数,当不存在未解码的非零系数时,结束量化块的解码;当存在未解码的非零系数时,将所述非零系数的下标值加1得到更新后的当前扫描位置,继续以当前扫描位置为起始扫描位置解码下一个游程长度,直至完成量化块的解码。采用本申请的技术方案,能够提升量化块的解码效率。

    视频编码、解码方法及其帧间预测方法和装置

    公开(公告)号:CN105681805B

    公开(公告)日:2019-05-21

    申请号:CN201610035562.9

    申请日:2016-01-19

    Abstract: 一种视频编码、解码方法及其帧间预测方法和装置,其中,帧间预测方法包括:获取当前图像块的运动矢量以及当前像素的相关空间位置信息;根据当前图像块的运动矢量以及当前像素的相关空间位置信息得到当前像素的运动矢量;根据得到的当前像素的运动矢量得到当前像素的预测值。因此,在进行帧间预测时,不仅仅考虑当前图像块的运动矢量,还考虑当前像素的相关空间位置信息,可以适应不同的镜头畸变的特性以及当物体在画面中运动时产生的放大/缩小现象,从而提高计算像素的运动矢量时的准确性,提升视频编解码过程中帧间预测的性能和压缩效率。

Patent Agency Ranking