一种实现8K 120FPSSDI信号传输的方法及系统

    公开(公告)号:CN117857837A

    公开(公告)日:2024-04-09

    申请号:CN202311856129.8

    申请日:2023-12-29

    Abstract: 本发明公开一种实现8K 120FPS SDI信号传输的方法及系统,通过两个相同型号60FPS的SDI采集卡分时对同一信号源的数据进行采集并分别存放各自对应的缓冲区;创建一个节点,申请一个视频帧的内存放入节点;以奇偶帧交错的方式从两个缓冲区中读取数据,当缓冲区中的数据长度足够1帧时,唤醒编码送数据子线程将该帧数据最前边节点取出返回节点存放的帧数据;将帧数据压入编码器进行编码,返回后清除当前节点数据及当前节点。通过基于原有硬件,较低配置的2个60FPS的SDI采集卡,将两个60FPS的SDI采集卡连接至同一数据源,以分时采集、缓存的方式分时进行数据的获取,从而实现对现有较低硬件的性能的升级。

    基于改进YOLOv8的人体图片关键点检测方法、设备和存储介质

    公开(公告)号:CN117854107A

    公开(公告)日:2024-04-09

    申请号:CN202311862165.5

    申请日:2023-12-29

    Abstract: 本发明涉及图像处理技术领域,尤其涉及基于改进YOLOv8的人体图片关键点检测方法,包括以下步骤:S1:收集人体视频并截取人体图片,通过处理开源数据集和人体图片建立数据集;S2:开源数据集根据第一YOLOv8神经网络模型得到第一训练模型,保留第一训练模型权重,训练集上加载第一训练模型权重通过第一训练模型得到第二训练模型;S3:测试集根据第二训练模型验证模型效果,随后调整训练参数得到第三训练模型,监控视频输入模型检测,对人体图片关键点定位并输出显示。本发明使用SPD模块避免下采样导致信息丢失,EMA注意力模块有效融合空间和通道特征,新增的关键点空间约束损失,使关键点定位更加准确可靠,随机擦除数据增强使得模型更加鲁棒和具有泛化性。

    一种用于提升AI目标检测准确度和性能的优化方案

    公开(公告)号:CN117853568A

    公开(公告)日:2024-04-09

    申请号:CN202311814200.6

    申请日:2023-12-27

    Abstract: 本发明涉及AI人工智能目标检测技术领域,公开了一种用于提升AI目标检测准确度和性能的优化方案,采用多线程架构,自动检测服务器性能、检测目标个数和密集程度智能调节非极大值抑制NMS模式,包括:设置相关参数后开启若干次检测任务,通过基本的非极大值抑制NMS算法计算和比较所述检测任务的平均值与所述设置的参数,实现自动调整非极大值抑制NMS方案,结合多线程进行目标检测后标定目标位置,充分利用其各自优势,并且能适应于各种不同场景,实现目标较多或硬件性能足够时智能切换Soft NMS,目标较少或是硬件性能不足情况下智能切换Fast NMS,另可根据实际情况使用基本NMS。

    一种测试直播编转码时延的方法及系统

    公开(公告)号:CN117768683A

    公开(公告)日:2024-03-26

    申请号:CN202311729153.5

    申请日:2023-12-15

    Abstract: 本发明公开一种测试直播编转码时延的方法即系统,方法包括以下步骤:获取编转码处理后的直播数据,其中所述直播数据在进行编转码处理过程中,在每一帧直播数据的SEI NALU位置均插入特殊控制信息;从每一帧所述编转码处理后的直播数据的SEI信息中提取直播数据UTC时间;将本地系统的当前UTC时间与提取出的所述直播数据UTC时间进行比较,以得到所述直播数据编转码时延。通过在编码过程中添加特殊的控制信息来记录当前帧编码时UTC时间,在解码过程中对其进行解析和本地UTC时间对比,从而准确地计算出编转码延时。

    基于AI实时剪辑足球赛事中特定场景短视频的方法及系统

    公开(公告)号:CN117376639A

    公开(公告)日:2024-01-09

    申请号:CN202311208949.6

    申请日:2023-09-19

    Abstract: 本发明公开了一种基于AI实时剪辑足球赛事中特定场景短视频的方法,包括以下步骤:获取RTMP流将其解码为视频帧;将所述视频帧发送给AI原子能力,其中所述AI原子能力包括人脸引擎、OCR引擎、3D引擎;所述人脸引擎识别出对象的身份,所述OCR引擎识别出文本信息,所述3D引擎识别出动作分类;获取多个所述识别结果并按照预设规则进行合成以生成所述特定场景短视频。设置的decoder引擎实时对RTMP流进行解码以实时获取视频帧,再通过AI原子能力中的人脸引擎识别出对象的身份、OCR引擎识别出文本信息、3D引擎识别出动作分类,然后将识别到的数据进行合成,从而能够实现实时对足球赛事中特定场景的短视频的实时剪辑获取,避免人工剪辑耗时长、成本高的缺点。

    一种提高分布式视频转码效率的方法及系统

    公开(公告)号:CN117336532A

    公开(公告)日:2024-01-02

    申请号:CN202311304931.6

    申请日:2023-10-10

    Abstract: 本发明公开了一种提高分布式视频转码效率的方法,包括以下步骤:接收视频转码任务,根据系统预置配置参数对视频转码任务所需要的CPU资源进行预分配;基于预分配结果创建POD服务,创建的所述POD服务完整执行切片、转码、合片任务;合片任务完成后将未被调度的POD服务销毁释放资源。通过动态调整POD服务资源分配和切片数量、复用已创建的POD服务和实现POD服务动态扩缩,CPU资源的充分利用、减少POD服务的创建,从而提高整体转码效率。

    多画面合成方法、装置、设备及存储介质

    公开(公告)号:CN112511768B

    公开(公告)日:2024-01-02

    申请号:CN202011357310.0

    申请日:2020-11-27

    Abstract: 本发明公开了一种多画面合成方法、装置、设备及存储介质,针对现有的多画面合成技术,当输入源增多时,计算复杂度增加,多画面合成效率变低,实时性变差,严重影响用户的观看体验的问题,通过从CDN云服务器订阅输入码流到本地,对输入流进行解封装、解码,并记录此时UTC时间戳,建立时间同步统一基准;视频合成时,采用多进一出模型,对输入源相同的UTC时间戳,一次性合成,提高视频合成效率,防止造成视频播放卡顿,提升用户的观看体验感。

    一种用于实现8K 120fps实时编码优化的方法及系统

    公开(公告)号:CN117061765A

    公开(公告)日:2023-11-14

    申请号:CN202311043125.8

    申请日:2023-08-18

    Abstract: 本发明涉及超高清视频编码技术领域,提供一种用于实现8K120fps实时编码优化的方法及系统,包括步骤S1,创建一个输入内存池用于存储帧地址,同时将用于接收并处理输入帧的编码器进行初始化;步骤S2,通过GOP节点接收输入帧的帧地址,并将帧地址放入GOP节点的帧列表中;步骤S3,创建X个并行实例子线程对所述GOP节点中的所述帧地址对应的所述输入帧进行编码,写入到输出缓冲区;步骤S4,通过子线程对于编码帧的DTS值进行矫正排序,同时主线程对输出缓冲区中的取出编码帧;步骤S5,对编码帧进行封装并输出。本发明通过GOP缓冲区和多线程机制,多个编码实例对不同GOP分片并行编码,并且利用NUMA和绑核机制更合理利用物理机的CPU和内存资源,实现8k 120fps实时编码输出。

    视频画质提升方法、装置及设备
    110.
    发明公开

    公开(公告)号:CN116939248A

    公开(公告)日:2023-10-24

    申请号:CN202310964976.X

    申请日:2023-08-02

    Abstract: 本发明公开了一种视频画质提升方法,对源视频进行解码并拆分成一帧帧图像,将每帧图像输入x2超分网络,得到高分辨率图像;同时,将每帧图像输入x2插值网络,得到的图像与高分辨率图像做差,得到高分辨率下的图像失真信息;将该图像失真信息输入下采样网络,得到低分辨率下的图像失真信息;将低分辨率下的图像失真信息与原图像帧叠加,得到高质量图像;对一帧帧高质量图像进行合并,得到高画质视频。其中,下采样网络没有直接作用于x2超分结果,而是作用于超分结果和插值结果的差,从而获得低分辨率下的失真差异信息,最后与原图叠加获得重组图像。如此设计充分借鉴了超分网络的残差学习思想,保证了原图的信息没有丢失,进而使网络更具有鲁棒性。

Patent Agency Ranking