一种基于分布式多芯片解码的高通量视频实时分析处理方法及装置

    公开(公告)号:CN116847104A

    公开(公告)日:2023-10-03

    申请号:CN202310930006.8

    申请日:2023-07-27

    Abstract: 本发明公开了一种基于分布式多芯片解码的高通量视频实时分析处理方法及装置,涉及音视频处理技术领域。该视频实时分析处理装置包括CPU单元、解码单元和分析单元;CPU单元包括资源初始化模块、视频数据预处理模块和调度处理模块,解码单元上承载解码处理模块,分析单元承载分析处理模块。视频数据预处理模块对原始视频数据进行格式过滤,传输给调度处理模块,调度处理模块给视频数据分配固定的解码处理模块;解码处理模块对视频数据进行解码,并筛选关键帧,最后通过基于PCIE总线的视频数据直接传输技术传送给分析处理模块;分析处理模块对视频数据进行计算处理,输出最终视频分析结果。本发明有效降低了CPU的资源消耗,达到高并发高通量的效果。

    一种基于神经辐射场和隐属性的虚拟主播生成方法与系统

    公开(公告)号:CN117171392A

    公开(公告)日:2023-12-05

    申请号:CN202311094348.7

    申请日:2023-08-28

    Abstract: 本发明公开了一种基于神经辐射场和隐属性的虚拟主播生成方法与系统,属于人工智能技术领域。根据需要确定虚拟主播的人物形象,并通过虚拟主播生成系统进行合成。首先通过人脸特征提取与构建模块合成虚拟主播的三维人脸。然后将需要播报的文本信息通过语音合成模块合成虚拟主播的语音。提取虚拟主播的语音、唇部运动、头部运动和眼睛眨动特征,并通过改进的NeRF网络模块结合各特征对虚拟主播的视频进行合成。最后替换合成视频的背景,合成最终的虚拟主播。本发明生成的虚拟主播具有高效稳定性和更高的真实度,能够适用于不同领域的虚拟主播制作。

Patent Agency Ranking