一种视频编、解码方法和装置

    公开(公告)号:CN104113765A

    公开(公告)日:2014-10-22

    申请号:CN201410364601.0

    申请日:2014-07-28

    Abstract: 一种视频编、解码方法和装置,通过判断当前图像块的重建块边界是否满足滤波条件,如果满足,则对当前图像块的重建块边界进行滤波;如果不满足,则不对当前图像块的重建块边界进行滤波。其中,滤波条件中的第一阈值和第二阈值根据当前图像块的编码量化参数来获取,使得第一阈值和第二阈值可以根据量化参数的动态变化而变化。因此,能够通过滤波条件准确判断出当前图像块的重建块边界为真实边界还是伪边界,对伪边界进行滤波,从而改善视频编解码中的块效应。另外,将第一阈值和第二阈值编入编码码流中,降低编码码率,在解码装置中,直接从码流中提取该第一阈值和第二阈值,降低了解码装置的运算量,提高解码效率。

    基于方向和距离判别的运动矢量预测方法

    公开(公告)号:CN103118256A

    公开(公告)日:2013-05-22

    申请号:CN201310034524.8

    申请日:2013-01-29

    Abstract: 本发明公开了一种基于方向和距离判别的运动矢量预测方法,适用于视频编解码技术领域,包括:区分运动矢量的方向和分别对x和y分量将距离最接近的两个运动矢量分量取平均值。分别对当前编码块邻近的三个运动矢量的x和y分量做如下操作:若有一个分量的方向与另两个不一样,则丢掉该分量,将另外两个分量的平均值作为最后的预测矢量分量;若三个分量的方向均一样,则从中选出距离最接近的两个分量,再用它们平均值作为最后的预测矢量分量。

    一种基于深度语义空间的跨媒体检索方法

    公开(公告)号:CN108694200B

    公开(公告)日:2019-12-20

    申请号:CN201710230070.X

    申请日:2017-04-10

    Abstract: 本发明公布了一种基于深度语义空间的跨媒体检索方法,包括特征生成阶段和语义空间学习阶段;特征生成阶段通过模拟人对图像的感知过程,生成图像的CNN视觉特征向量和LSTM语言描述向量;利用LDA主题模型挖掘文本的主题信息,进而提取LDA文本主题向量。在语义空间学习阶段,分别利用训练集图像训练得到一个四层的多感知融合的深度神经网络,利用训练集文本训练得到一个三层的文本语义网络。最后将测试图像和文本分别利用两个网络映射到同构的语义空间,从而实现跨媒体检索。与现有方法相比,本发明能够显著提升跨媒体检索性能,具有广阔的应用前景和市场需求。

    一种基于P帧的多假设运动补偿方法

    公开(公告)号:CN104488271B

    公开(公告)日:2019-05-07

    申请号:CN201380003167.7

    申请日:2013-07-26

    Abstract: 一种基于P帧的多假设运动补偿方法,包括:以当前图像块的相邻已编码图像块作为参考图像块,利用参考图像块的运动矢量获得当前图像块的第一运动矢量,所述第一运动矢量指向第一预测块;以所述第一运动矢量为参考值,对当前图像块进行联合运动估计获得当前图像块的第二运动矢量,所述第二运动矢量指向第二预测块;对所述第一预测块和所述第二预测块进行加权平均,获得当前图像块的最终预测块。该方法可以使当前图像块获得的预测块的准确性更高,且不会增大码流码率。

    一种基于双语义空间的对抗性跨媒体检索方法

    公开(公告)号:CN109344266A

    公开(公告)日:2019-02-15

    申请号:CN201811106799.7

    申请日:2018-09-21

    Abstract: 本发明公布了一种基于双语义空间的对抗性跨媒体检索方法,涉及模式识别、自然语言处理、多媒体检索等技术领域;包括:特征生成过程、双语义空间的构建过程和对抗性语义空间优化过程。本发明通过建立同构双语义空间,即文本子空间和图像子空间,实现在最大限度保留原有图像和文本信息的同时消除语义鸿沟;并通过对抗训练来优化同构子空间数据分布,挖掘多媒体数据中丰富的语义信息,在保证类别不变、模态可区分的情况下拟合语义空间中不同模态的向量分布。本发明方法能够有效的消除不同模态信息异构性,实现有效的跨媒体检索,在图文检索、模式识别等领域具有广泛的市场需求和应用前景。

    一种基于局部PCA白化的图像表示方法和处理装置

    公开(公告)号:CN105205497B

    公开(公告)日:2019-01-15

    申请号:CN201510585376.8

    申请日:2015-09-15

    Abstract: 一种基于局部PCA白化的图像表示方法和处理装置,其中,第一映射模块将单词和特征映射到一个高维度空间;主成分分析模块在对应的每个单词空间中进行主成分分析,得到投影矩阵;VLAD计算模块计算VLAD图像表示向量;第二映射模块将所述VLAD图像表示向量映射到所述高维度空间中;投影变换模块将投影得到的VLAD图像表示向量进行投影变换;归一化处理模块将投影变换得到的特征进行归一化,得到最后的图像表示向量。对于得到的图像表示向量,首先将其投影到一个高维度空间中,然后对提前计算好的投影矩阵,对每个单词对应向量进行投影变换,得到一个低维度的向量,这样使得每个单词对应的向量是一致的。该方法和处理装置具有更好的鲁棒性和更高的性能。

    一种基于字典匹配的图像超分辨率重建方法及装置

    公开(公告)号:CN105389778B

    公开(公告)日:2018-10-12

    申请号:CN201510741060.3

    申请日:2015-11-04

    Abstract: 本申请还提供一种基于字典匹配的图像超分辨率重建方法及装置,建立匹配字典库,将待重建图像输入多层线滤波器网络,提取待重建图像的局部特征,从匹配字典库中寻找与所述待重建图像的局部特征相似度最高的低分辨率图像块的局部特征,寻找在匹配字典库中,所述相似度最高的低分辨率图像块的局部特征所在联合样本的残差值,对相似度最高的低分辨率图像块的局部特征进行插值放大,加上残差值,获得重建后的高分辨率图像块。经过多层线滤波器网络提取的待重建图像的局部特征,精度更高,因此在后续与匹配字典库匹配时,匹配度更高,因而重建出的图像质量也跟好。因而,本申请可以大大提升重建的高分辨率图像的质量。

    视频压缩编码方法及编码器

    公开(公告)号:CN104396246B

    公开(公告)日:2018-07-06

    申请号:CN201380000788.X

    申请日:2013-06-26

    CPC classification number: H04N19/436

    Abstract: 本申请公开了一种视频压缩编码方法及编码器,主控模块将待编码的图像帧按照预定顺序逐个分发至空闲的帧编码模块后,帧编码模块中空闲的块编码模块根据对应图像帧中块的编码状态信息,互斥地选取具备编码条件但未编码的块进行编码,并在编码完成后更新块的编码状态信息,而当图像帧的编码完成后,更新帧编码模块的空闲状态信息。这样就能真正做到以块为任务分发单位,只要图像中可立即编码的块的数目超过块编码线程数,所有线程就能够被充分利用,大大减少了对下方宏块进行编码的线程出现等待的情况,进而减少了块间同步的次数,降低了并行视频压缩编码通信代价,提高了视频压缩编码性能。

Patent Agency Ranking