-
公开(公告)号:CN117376639A
公开(公告)日:2024-01-09
申请号:CN202311208949.6
申请日:2023-09-19
Applicant: 上海网达软件股份有限公司
IPC: H04N21/44 , H04N21/472 , H04N21/85 , G06V40/16 , G06V40/20 , G06V30/10 , G06V20/40 , G06N3/0442 , G06N3/0464 , G06V10/82
Abstract: 本发明公开了一种基于AI实时剪辑足球赛事中特定场景短视频的方法,包括以下步骤:获取RTMP流将其解码为视频帧;将所述视频帧发送给AI原子能力,其中所述AI原子能力包括人脸引擎、OCR引擎、3D引擎;所述人脸引擎识别出对象的身份,所述OCR引擎识别出文本信息,所述3D引擎识别出动作分类;获取多个所述识别结果并按照预设规则进行合成以生成所述特定场景短视频。设置的decoder引擎实时对RTMP流进行解码以实时获取视频帧,再通过AI原子能力中的人脸引擎识别出对象的身份、OCR引擎识别出文本信息、3D引擎识别出动作分类,然后将识别到的数据进行合成,从而能够实现实时对足球赛事中特定场景的短视频的实时剪辑获取,避免人工剪辑耗时长、成本高的缺点。
-
公开(公告)号:CN116939248A
公开(公告)日:2023-10-24
申请号:CN202310964976.X
申请日:2023-08-02
Applicant: 上海网达软件股份有限公司
IPC: H04N21/2343 , G06T3/40 , H04N21/4402 , H04N19/59
Abstract: 本发明公开了一种视频画质提升方法,对源视频进行解码并拆分成一帧帧图像,将每帧图像输入x2超分网络,得到高分辨率图像;同时,将每帧图像输入x2插值网络,得到的图像与高分辨率图像做差,得到高分辨率下的图像失真信息;将该图像失真信息输入下采样网络,得到低分辨率下的图像失真信息;将低分辨率下的图像失真信息与原图像帧叠加,得到高质量图像;对一帧帧高质量图像进行合并,得到高画质视频。其中,下采样网络没有直接作用于x2超分结果,而是作用于超分结果和插值结果的差,从而获得低分辨率下的失真差异信息,最后与原图叠加获得重组图像。如此设计充分借鉴了超分网络的残差学习思想,保证了原图的信息没有丢失,进而使网络更具有鲁棒性。
-
公开(公告)号:CN116886959A
公开(公告)日:2023-10-13
申请号:CN202311021447.2
申请日:2023-08-15
Applicant: 上海网达软件股份有限公司
IPC: H04N21/2343 , H04N21/4402
Abstract: 本发明涉及视频处理和视频画质增强领域,提供了一种高效实时光流法深度学习视频插帧方法,使用I FNet模型作为中间流网络,将输入图像t0时刻帧和t1时刻帧输入I FNet模型的三个模块中进行4倍、2倍、1倍降采样提取特征,采取从粗到细的策略首先进行4倍降采样特区特征,按照正向顺序和反向顺序输入分别得到正反向光流和正反向掩膜,将正反向光流和正反向掩膜进行融合,再使用融合光流对输入原图像进行warp i ng操作,最后根据融合掩膜对正反向光流生成的图像做加权操作,使得图像像素根据光流产生偏移运动到指定位置,得到插帧图像,实现根据不同配置同时输出多个时间片插帧,效率显著提升。
-
公开(公告)号:CN114372930A
公开(公告)日:2022-04-19
申请号:CN202111655763.6
申请日:2021-12-30
Applicant: 上海网达软件股份有限公司
Abstract: 本发明是一种一种视频对比度增强方法及系统,特别是基于自监督学习的视频对比度增强算法,利用无监督图像质量评价模型引导训练视频对比度增强算法模型,本发明可在cpu上实现实时的视频对比度增强。本发明受图像直方图均衡化算法的启发,设计了一种自适应的灰度映射机制,利用无监督图像质量评价模型作为引导,回归得到了Map映射矩阵;根据不同的图像,会得到不同Map映射矩阵用于视频对比度增强,无需人为干预,在算法的使用上特别友好。
-
公开(公告)号:CN114363477A
公开(公告)日:2022-04-15
申请号:CN202111657429.4
申请日:2021-12-30
Applicant: 上海网达软件股份有限公司
Abstract: 本发明公开了一种基于滑窗权重回归的视频自适应锐化的方法及系统,通过构建基于滑窗权重回归的神经网络模型,以神经网络模型回归每帧图像中每个像素位置及其8邻域的权重;采用get_weights函数获取神经网络模型的训练权重,得到维度为[1,9,height,width]的特征,使图像的每个像素位置输出9个权重;将当前像素及其8邻域,根据相应的9个权重进行加权,得到锐化后的图像。不需要设置参数就能够自适应处理多种视频场景,能够达到实时处理的要求,更能突出图像的边缘和细节。
-
公开(公告)号:CN114372933A
公开(公告)日:2022-04-19
申请号:CN202111675149.6
申请日:2021-12-31
Applicant: 上海网达软件股份有限公司
IPC: G06T5/00
Abstract: 一种基于Huber函数的视频自适应锐化方法和系统,其方法包括:S1:通过图片数据集训练Huber分段函数的至少参数a,b,c;S2:将预处理的图像YCbCr数据在Y分量上计算梯度信息g,再把取值范围[0,255]的所述梯度信息归一化到区间[0,c],以完成所述些梯度信息映射到a,b,c三个范围内;S3:根据所述梯度信息来自动调整输出图像的锐化强度。采用L1loss有效的监督学习方式,先计算yg,然后gtg,然后是idx,最后得出这个L1loss。本发明是一种基于Huber函数的视频自适应锐化算法,能够自适应处理多种视频场景,能够达到实时处理的要求,更能突出图像的边缘和细节。
-
公开(公告)号:CN117853878A
公开(公告)日:2024-04-09
申请号:CN202311816678.2
申请日:2023-12-27
Applicant: 上海网达软件股份有限公司
Abstract: 本发明涉及AI人工智能技术领域,具体地,涉及一种适用于边缘AI设备的检测方法、设备及存储介质。与现有技术相比,本申请提出的技术方案具有如下的有益效果:本发明从模型结构、硬件加速和动态调整策略等多个角度出发,提供了一套综合而创新的技术方案。通过引入NVIDIA‑DALI并行处理,提升预处理速度。推理优化方面使用Triton inference server(模型推理服务器)架构,实现异步多模型推理,通过硬件并行计算,充分发挥GPU硬件平台的性能。此外,本发明提出动态调整输入分辨率和推理精度的方法,以在不同场景下平衡性能和速度。
-
公开(公告)号:CN116958880A
公开(公告)日:2023-10-27
申请号:CN202310960594.X
申请日:2023-08-01
Applicant: 上海网达软件股份有限公司 , 上海航天信息科技有限公司 , 上海航天信息科技研究院
Abstract: 本发明提供了一种视频火焰前景分割预处理方法、装置、设备及存储介质,包括:获取原始视频图像并进行预处理;基于混合高斯模型的聚类算法对预处理后的视频图像进行前景分割;将疑似火焰区域通过HIS颜色空间进行特征判断;对筛选后的火焰目标区域绘制检测框;根据所述火焰目标选框之间的距离选取相邻的火焰目标选框区域进行合并;在合并后的火焰目标选框区域具有重叠的情况下,对火焰目标选框区域进行融合;将融合后的火焰目标选框区域作为最终掩码图像,与原始视频图像做位与运算,在原始视频图像上分割出最终框选的火焰目标彩色图像,解决当前神经网络检测模型对于视频火焰检测场景中漏检,误检率高的问题,减少漏检误检的情况。
-
公开(公告)号:CN114372933B
公开(公告)日:2025-03-25
申请号:CN202111675149.6
申请日:2021-12-31
Applicant: 上海网达软件股份有限公司
Abstract: 一种基于Huber函数的视频自适应锐化方法和系统,其方法包括:S1:通过图片数据集训练Huber分段函数#imgabs0#的至少参数a,b,c;S2:将预处理的图像YCbCr数据在Y分量上计算梯度信息g,再把取值范围[0,255]的所述梯度信息归一化到区间[0,c],以完成所述些梯度信息映射到a,b,c三个范围内;S3:根据所述梯度信息来自动调整输出图像的锐化强度。采用L1loss有效的监督学习方式,先计算yg,然后gtg,然后是idx,最后得出这个L1loss。本发明是一种基于Huber函数的视频自适应锐化算法,能够自适应处理多种视频场景,能够达到实时处理的要求,更能突出图像的边缘和细节。
-
公开(公告)号:CN117765153A
公开(公告)日:2024-03-26
申请号:CN202311758463.X
申请日:2023-12-20
Applicant: 上海网达软件股份有限公司
Abstract: 本发明涉及图像渲染技术领域,尤其涉及一种基于NeRF的园区三维渲染方法及系统,包括步骤S1、获取园区全方位的二维图像及对应的相机位姿信息,构成用于训练NeRF网络的数据集;步骤S2、构建所述NeRF网络,对所述数据集进行训练,获得所述园区对应的三维神经场模型;步骤S3、将所述三维模型导出至3D渲染引擎进行处理和实时监控视频流集成,再整合到Web客户端进行展示。本发明结合NeRF技术通过给定的视角和位置渲染出高质量的三维图像,开发Web客户端、整合三维模型与视频流以及提供用户交互接口进行展示交互,以提高3D渲染的质量和效率。
-
-
-
-
-
-
-
-
-