-
公开(公告)号:CN114915789A
公开(公告)日:2022-08-16
申请号:CN202210385961.3
申请日:2022-04-13
Applicant: 中南大学
IPC: H04N19/19 , H04N19/503 , H04N19/147
Abstract: 本发明公开了一种帧间的拉格朗日乘子优化方法、系统、设备及介质,包括以下步骤:获取目标编码视频当前时刻的位置向量,位置向量的值对应每帧λ的放缩系数,根据当前时刻的位置向量计算当前时刻的适应值,根据当前的适应值利用灰狼优化算法计算目标编码视频的下一时刻的位置向量,根据下一时刻的位置向量计算下一时刻的适应值,依次迭代,直至当下一时刻的适应值达到预设值或者达到最大迭代次数,得到最优放缩系数,根据最优放缩系数计算得到最优λ。本方法中灰狼优化算法可优化非线性不可导问题,算法中每只狼的位置对应每一次的帧级λ搜索值,实现了在有效计算次数内搜索出帧级最优λ,使得编码器具有更高的压缩效率。
-
公开(公告)号:CN113242427A
公开(公告)日:2021-08-10
申请号:CN202110398165.9
申请日:2021-04-14
Applicant: 中南大学
IPC: H04N19/139 , H04N19/96
Abstract: 本发明公开了一种基于VVC中自适应运动矢量精度的快速方法及装置,方法包括:获取编码单元于普通AMVR过程的1/4精度CME的最优MV水平分量和最优MV垂直分量;当编码单元于Affine AMVR过程遍历至1/16精度,且1/4精度CME的最优MV水平分量等于0,则在细化搜索CPMV的周围八个点时,仅插值垂直方向的1/16像素点;或者垂直分量等于0也是同理,仅插值水平方向的1/16像素点。本发明简化了1/16精度的仿射运动估计,减少Affine AMVR的计算复杂度,提高了VVC编码效率,提升了编码器性能。本发明还能够有效的跳过1精度、4精度以及1/2精度的普通运动估计以及有条件的跳过1精度仿射运动估计,可以降低编码的时间复杂度,能够有效的提升编码器的效率,可以方便地投入实际应用。
-
公开(公告)号:CN113055676B
公开(公告)日:2024-04-26
申请号:CN202110331278.7
申请日:2021-03-26
Applicant: 中南大学
IPC: H04N19/172 , H04N19/513 , H04N19/70 , H04N19/42 , G06N3/0464 , G06N3/08
Abstract: 本发明公开了一种基于深度网络视频编解码的后处理优化方法,包括:读取解码图像,在时空可变融合模块中对解码图像进行偏移量预测,偏移量预测包括对解码图像进行两次下采样和两次上采样,以得到第一偏移量;获取参考帧的运动矢量;根据运动矢量和第一偏移量计算得到第二偏移量;将第二偏移量用可变卷积计算得到特征图,使用图像质量提升模块处理特征图以得到残差图,将残差图加到解码图像以得到图像质量增强的解码图像。能够在具有较好的图像后处理增强质量的情况下,极大的简化了模型结构,缩短了神经网络卷积计算时间,降低了算法复杂度,提升了对码流中存在的解码信息的利用率,满足应用的实时需求。
-
公开(公告)号:CN114915789B
公开(公告)日:2023-03-14
申请号:CN202210385961.3
申请日:2022-04-13
Applicant: 中南大学
IPC: H04N19/19 , H04N19/503 , H04N19/147
Abstract: 本发明公开了一种帧间的拉格朗日乘子优化方法、系统、设备及介质,包括以下步骤:获取目标编码视频当前时刻的位置向量,位置向量的值对应每帧λ的放缩系数,根据当前时刻的位置向量计算当前时刻的适应值,根据当前的适应值利用灰狼优化算法计算目标编码视频的下一时刻的位置向量,根据下一时刻的位置向量计算下一时刻的适应值,依次迭代,直至当下一时刻的适应值达到预设值或者达到最大迭代次数,得到最优放缩系数,根据最优放缩系数计算得到最优λ。本方法中灰狼优化算法可优化非线性不可导问题,算法中每只狼的位置对应每一次的帧级λ搜索值,实现了在有效计算次数内搜索出帧级最优λ,使得编码器具有更高的压缩效率。
-
公开(公告)号:CN113055676A
公开(公告)日:2021-06-29
申请号:CN202110331278.7
申请日:2021-03-26
Applicant: 中南大学
IPC: H04N19/172 , H04N19/513 , H04N19/70 , H04N19/42 , G06N3/04 , G06N3/08
Abstract: 本发明公开了一种基于深度网络视频编解码的后处理优化方法,包括:读取解码图像,在时空可变融合模块中对解码图像进行偏移量预测,偏移量预测包括对解码图像进行两次下采样和两次上采样,以得到第一偏移量;获取参考帧的运动矢量;根据运动矢量和第一偏移量计算得到第二偏移量;将第二偏移量用可变卷积计算得到特征图,使用图像质量提升模块处理特征图以得到残差图,将残差图加到解码图像以得到图像质量增强的解码图像。能够在具有较好的图像后处理增强质量的情况下,极大的简化了模型结构,缩短了神经网络卷积计算时间,降低了算法复杂度,提升了对码流中存在的解码信息的利用率,满足应用的实时需求。
-
公开(公告)号:CN113242427B
公开(公告)日:2024-03-12
申请号:CN202110398165.9
申请日:2021-04-14
Applicant: 中南大学
IPC: H04N19/139 , H04N19/96
Abstract: 本发明公开了一种基于VVC中自适应运动矢量精度的快速方法及装置,方法包括:获取编码单元于普通AMVR过程的1/4精度CME的最优MV水平分量和最优MV垂直分量;当编码单元于Affine AMVR过程遍历至1/16精度,且1/4精度CME的最优MV水平分量等于0,则在细化搜索CPMV的周围八个点时,仅插值垂直方向的1/16像素点;或者垂直分量等于0也是同理,仅插值水平方向的1/16像素点。本发明简化了1/16精度的仿射运动估计,减少Affine AMVR的计算复杂度,提高了VVC编码效率,提升了编码器性能。本发明还能够有效的跳过1精度、4精度以及1/2精度的普通运动估计以及有条件的跳过1精度仿射运动估计,可以降低编码的时间复杂度,能够有效的提升编码器的效率,可以方便地投入实际应用。
-
公开(公告)号:CN115580723B
公开(公告)日:2023-06-09
申请号:CN202211575962.0
申请日:2022-12-09
Applicant: 中南大学
IPC: H04N19/109 , H04N19/176 , H04N19/196 , H04N19/503
Abstract: 本发明公开了一种屏幕内容图像的编码优化方法、系统、设备及介质,本方法将屏幕内容图像集合输入至编码器中进行编码,得到Lookahead模块输出的当前帧;通过如下任意一种条件对当前帧进行优化:若当前帧为I帧或I帧后的第一个P帧,调整当前帧的QP;若当前帧为I帧后连续的第n个P帧,调整n个P帧中每个P帧的QP;若当前帧为I帧后连续的第m个P帧且当前帧为帧行内刷新,按时序调整m个P帧中每个P帧中的若干行宏块的QP;本发明具有简单可行和计算量低的特点,主要利用帧间预测的前向参考的特点,加上屏幕内容场景长时间变化较小,提出了针对调整帧级或宏块级QP的优化条件,来改善文字等细节要求较高区域的主观质量。
-
公开(公告)号:CN115580723A
公开(公告)日:2023-01-06
申请号:CN202211575962.0
申请日:2022-12-09
Applicant: 中南大学
IPC: H04N19/109 , H04N19/176 , H04N19/196 , H04N19/503
Abstract: 本发明公开了一种屏幕内容图像的编码优化方法、系统、设备及介质,本方法将屏幕内容图像集合输入至编码器中进行编码,得到Lookahead模块输出的当前帧;通过如下任意一种条件对当前帧进行优化:若当前帧为I帧或I帧后的第一个P帧,调整当前帧的QP;若当前帧为I帧后连续的第n个P帧,调整n个P帧中每个P帧的QP;若当前帧为I帧后连续的第m个P帧且当前帧为帧行内刷新,按时序调整m个P帧中每个P帧中的若干行宏块的QP;本发明具有简单可行和计算量低的特点,主要利用帧间预测的前向参考的特点,加上屏幕内容场景长时间变化较小,提出了针对调整帧级或宏块级QP的优化条件,来改善文字等细节要求较高区域的主观质量。
-
公开(公告)号:CN115830711A
公开(公告)日:2023-03-21
申请号:CN202211500177.9
申请日:2022-11-28
Applicant: 中南大学
IPC: G06V40/20 , G06V20/40 , G06V10/46 , G06V10/764 , G06V10/771 , G06V10/77 , G06V10/82 , G06N3/0442 , G06N3/045
Abstract: 本发明公开了基于深度学习的手语词汇识别方法、系统、设备及介质,本方法通过获取手语视频;将手语视频输入至训练好的人体姿态估计网络模型中进行第一特征提取,获得手语视频中的heatmap图;通过基于时序轻量的特征快速筛选模型进行第二特征提取,获得heatmap空间特征;将heatmap空间特征进行人体关键点信息的空间特征筛选,获得人体关键点空间特征;通过带有attention机制的双向LSTM时间序列模型进行特征学习,获得手语视频学习结果;通过全连接层和softmax层进行分类和编码,获得手语视频分类编码结果;根据手语视频分类编码结果,查询得到手语词汇识别结果。本发明能够提高手语识别的准确度。
-
公开(公告)号:CN115103188B
公开(公告)日:2022-12-30
申请号:CN202211017771.2
申请日:2022-08-24
Applicant: 中南大学
IPC: H04N19/34 , H04N19/146 , H04N19/166 , H04N19/30 , G06T3/40 , G06N3/04 , G06N3/08
Abstract: 本申请实施例涉及技术领域,特别涉及一种SVC的错误隐藏方法、模型训练方法、系统及设备,本申请利用卷积神经网络充分提取前一帧基础层和增强层图像对中的偏移量参数,进而利用这个参数来修正当前帧的基础层图像的上采样图像,从而提升增强层错误隐藏的效果;本申请还计算前一帧的增强层图像和前一帧的基础层图像之间的残差图像,然后通过卷积神经网络融合残差图像和修正后的上采样图像,充分利用时域和空域的相关性对修正后的上采样图像进行后处理,提升了增强层错误隐藏的效果。
-
-
-
-
-
-
-
-
-