一种支持多种计算复杂度的深度视频编解码方法

    公开(公告)号:CN118474377B

    公开(公告)日:2024-09-24

    申请号:CN202410926618.4

    申请日:2024-07-11

    Abstract: 本发明涉及视频处理与编码技术领域,具体公开了一种支持多种计算复杂度的深度视频编解码方法。该深度视频解码方法包括:S1、在编码器一侧以输入帧和参考帧作为输入,进行运动估计;S2、通过运动压缩模块处理来自运动估计模块的运动信息,得到解码运动信息;S3、通过给定的参考帧与解码运动信息,执行运动补偿,生成预测帧;S4、通过残差压缩模块,根据输入帧和预测帧生成残差信息;S5、将重构后的残差信息添加回预测帧中,生成重构输出帧。利用上述方法,实现使用一个学习解码器而不是多个解码器,就能同时支持多种复杂度级别的效果,并且能够在性能下降可忽略不计的情况下提高其解码效率。

    一种图像实时可控去噪方法、系统及计算机可读介质

    公开(公告)号:CN118411306A

    公开(公告)日:2024-07-30

    申请号:CN202410888768.0

    申请日:2024-07-04

    Abstract: 本发明涉及本发明涉及图像处理领域,具体公开了一种图像实时可控去噪方法、系统及计算机可读介质。图像实时可控去噪方法包括:通过主干网络生成多个固定级别的噪声特征图;将这些噪声特征图作为输入送入噪声去相关模块,强化其噪声分布的正交性;对得到的零相关噪声特征图进行简单的线性插值实现可控的去噪效果;自动调整模块给出一组最优的控制参数以生成最终的去噪图像。利用上述方法,在噪声去相关过程中加强了噪声特征图的正交性,从而通过噪声特征图插值实现任意噪声级别控制,且不需要网络推理,实现了图像去噪过程的实时性与可控性。

    一种用于矿下低质视频快速增强的编码方法

    公开(公告)号:CN117560494A

    公开(公告)日:2024-02-13

    申请号:CN202410038681.4

    申请日:2024-01-11

    Abstract: 一种用于矿下低质视频快速增强的编码方法,步骤:利用检测摄像头获取煤矿井下多种光线条件下的低照度和低清晰度视频流数据;对获取的视频流数据进行处理,截取出低照度场景视频,构建井下低质视频数据集;通过帧插值器接收两个参考帧并进行帧插值操作生成一个参考帧;确定Gop结构,利用I帧编码器和P帧编码器分别对I帧和P帧进行编码;将参考帧作为参考,通过当前P帧编码器对输入的B帧进行编码。本发明为现有的神经P帧编解码器增加B帧编码功能,大大提高了P帧编码器对低质视频的增强编码性能,且具有很强的灵活性和泛化性;实现了对Gop结构的全面分析,提高了整体编码效率;为煤矿安全管理提供科学数据支持,提高了安全管理水平。

    一种基于YM_SSH的轻量级目标检测的疲劳状态检测方法

    公开(公告)号:CN115578719A

    公开(公告)日:2023-01-06

    申请号:CN202211253174.X

    申请日:2022-10-13

    Abstract: 本发明公开了一种基于YM_SSH的轻量级目标检测的疲劳状态检测方法,具体包括以下步骤:数据集准备,结合国内疲劳检测公共数据建立疲劳状态检测数据集;神经网络搭建,使用MobileViT代换YOLOv3的主干网络Darknet53,使用小尺寸卷积核代替大尺寸卷积核,搭建具有更大有效感受野的轻量级网络YM_SSH,使用改进的SSH网络增大模型感受野;减半网络通道数,将网络模型轻量化;嵌入式部署,将模型转化为TensorRT模型,提高模型在移动终端的推理速度。本发明基于轻量级目标检测网络以及可分离深度卷积,在扩大特征感受野的同时减少卷积核计算量和参数量,并且检测速度和精度与原网络模型几乎持平,解决了实时疲劳检测精确度低的问题。

    一种基于边缘对称填充和大感受野的路面病害检测方法

    公开(公告)号:CN115512324A

    公开(公告)日:2022-12-23

    申请号:CN202211253152.3

    申请日:2022-10-13

    Abstract: 本发明公开一种基于边缘对称填充和大感受野的路面病害检测方法,包括:数据集准备,结合道路环境重新标注公共数据集,并添加灌缝和井盖两个辅助类别;神经网络搭建,用大核深度可分离卷积配合重参数化搭建具有更大有效感受野和更多形状偏置的骨干网络RepLKDarkNet,用空间可分离深度卷积以及改进的对称填充策略搭建对位置信息保留更多的加强特征提取网络XSepPAFPN,用目标跟踪模块优化重识别问题;嵌入式部署,将模型转化为TensorRT模型。本发明基于大感受野特征以及应用边缘对称填充策略的空间可分离深度卷积,在提高特征图的有效感受野的同时减少大卷积核计算量和参数量,并在一定程度弥补特征提取时的信息丢失,解决路面病害样式和形状提取不准确影响检测精度的问题。

    一种改进YOLO-PAI的实时接打电话行为检测方法

    公开(公告)号:CN115439835A

    公开(公告)日:2022-12-06

    申请号:CN202211258003.6

    申请日:2022-10-13

    Abstract: 本发明公开了一种改进YOLO‑PAI的实时接打电话行为检测方法,步骤如下:从视频监控平台截取照片制作数据集,添加手和手机两个标签类别,手的标注辅助判断人是否存在接打电话行为;搭建新型卷积神经网络,对于主干网络CSPDarknet53进行剪枝,在保证精度的同时减少参数量。利用使用k‑means聚类算法获得的9个锚点解决小型目标检测问题,更好的检测手机特征信息。增加第四个尺度的特征映射分支,扩大检测范围;部署嵌入式设备,使用TensorRT深度学习推理框架。通过提出的SRblock_body结构,提取图像特征,构建更深层次网络改善网络结构,提高分类和检测效果,在保证检测精度的同时减少模型大小和参数量,更好的移植到嵌入式设备中。

    一种基于SaE-ELM的煤矿多等级突水预测方法

    公开(公告)号:CN104156560A

    公开(公告)日:2014-11-19

    申请号:CN201410331425.0

    申请日:2014-07-12

    Abstract: 基于SaE-ELM(Self-Adaptive Evolutionary Extreme Learning Machine)的煤矿多等级突水预测方法。包括以下步骤:1.研究煤矿突水机理,选取导致煤矿突水主控因素;2.搜集大量煤矿底板突水历史数据作为样本数据,每组数据包含各主控因素以及最大突水量;3.将样本数据划分为训练集和测试集,分别应用于模型的训练与测试;4.使用SaE-ELM对样本数据进行训练,建立预测模型;5.利用测试集数据对煤矿突水预测模型进行测试,将得到的预测结果与其他算法相比较,若预测精度高、速度快,则将其作为可对煤矿是否突水以及突水程度进行预测的模型。

Patent Agency Ranking