-
公开(公告)号:CN111314697B
公开(公告)日:2021-10-15
申请号:CN202010116219.3
申请日:2020-02-25
Applicant: 中南大学
IPC: H04N19/124 , H04N19/132 , H04N19/146 , H04N19/426 , G06K9/00
Abstract: 本发明公开了一种针对光字符识别的码率设置方法、设备及存储介质,本方法首先对图片进行下采样,其次对下采样图片进行多次编码求取使得下采样图片能够被正确识别的最优QP/Rate值(最低的码率值/量化系数值),然后根据置信度神经网络求取码率增加量M/量化系数增加量N,最后快速找到针对该原始图片的最优编码值,该最优编码值是使得原始图片的光字符识别精度不受影响的最低码率值/最低量化系数值。相较于现有技术,本发明不仅可以减少网络传输带宽,而且针对大量数以亿计的图片也可以减少存储空间的占用而减少成本。而且本发明涵盖了主流的混合编码架构的应用场景,可以采用任意一种图像编码标准或者视频编码标准的帧内编码方式,应用广泛。
-
公开(公告)号:CN111314697A
公开(公告)日:2020-06-19
申请号:CN202010116219.3
申请日:2020-02-25
Applicant: 中南大学
IPC: H04N19/124 , H04N19/132 , H04N19/146 , H04N19/426 , G06K9/00
Abstract: 本发明公开了一种针对光字符识别的码率设置方法、设备及存储介质,本方法首先对图片进行下采样,其次对下采样图片进行多次编码求取使得下采样图片能够被正确识别的最优QP/Rate值(最低的码率值/量化系数值),然后根据置信度神经网络求取码率增加量M/量化系数增加量N,最后快速找到针对该原始图片的最优编码值,该最优编码值是使得原始图片的光字符识别精度不受影响的最低码率值/最低量化系数值。相较于现有技术,本发明不仅可以减少网络传输带宽,而且针对大量数以亿计的图片也可以减少存储空间的占用而减少成本。而且本发明涵盖了主流的混合编码架构的应用场景,可以采用任意一种图像编码标准或者视频编码标准的帧内编码方式,应用广泛。
-
公开(公告)号:CN111586405B
公开(公告)日:2022-03-29
申请号:CN202010331912.2
申请日:2020-04-24
Applicant: 中南大学
IPC: H04N19/107 , H04N19/82 , H04N19/159 , H04N19/124 , H04N19/70 , H04N19/44
Abstract: 本发明提供了一种多功能视频编码中基于ALF滤波的预测模式快速选择方法,该方法的发明构思是利用ALF滤波过程中得到的方向梯度值来预测当前块的帧内预测的角度模式,缩小角度预测模式的搜索范围,以尽可能地降低编码时间,利用ALF滤波得到的方向梯度值来提前跳过不必要的CU划分模式,加速帧间编码的CU划分过程,步骤简单,计算量小,可方便地投入实际应用。
-
公开(公告)号:CN111586405A
公开(公告)日:2020-08-25
申请号:CN202010331912.2
申请日:2020-04-24
Applicant: 中南大学
IPC: H04N19/107 , H04N19/82 , H04N19/159 , H04N19/124 , H04N19/70 , H04N19/44
Abstract: 本发明提供了一种多功能视频编码中基于ALF滤波的预测模式快速选择方法,该方法的发明构思是利用ALF滤波过程中得到的方向梯度值来预测当前块的帧内预测的角度模式,缩小角度预测模式的搜索范围,以尽可能地降低编码时间,利用ALF滤波得到的方向梯度值来提前跳过不必要的CU划分模式,加速帧间编码的CU划分过程,步骤简单,计算量小,可方便地投入实际应用。
-
公开(公告)号:CN111611985A
公开(公告)日:2020-09-01
申请号:CN202010325757.3
申请日:2020-04-23
Applicant: 中南大学
Abstract: 本发明提供了一种基于模型融合的OCR识别方法,该方法采用若干识别模型搭建深度学习神经网络模型,所述识别模型分别对字符定位数据进行训练,至模型收敛后得到预输出识别结果,将所述预输出识别结果融合优化后输出最终识别结果。解决了多模型融合的OCR识别问题,相比传统的OCR识别方法,采用深度学习的多模型融合的OCR识别技术,不仅定位精准,而且识别的准确率高,模型识别效果更稳定。
-
-
-
-