-
公开(公告)号:CN118678047A
公开(公告)日:2024-09-20
申请号:CN202410893324.6
申请日:2024-07-04
Applicant: 上海华讯网络系统有限公司
IPC: H04N17/00 , H04N7/18 , H04L67/02 , H04L67/06 , H04L41/0896 , H04L67/1097
Abstract: 本发明提供了一种基于分布式和分组调度的视频图像质量诊断系统及方法,包括步骤S1:设置相关诊断参数;所述参数包括节点参数和被检测的摄像机信息;步骤S2:设置分组检测方案,开启检测过程;步骤S3:若检测到异常图像,则记录此时的摄像机信息并存入数据库进行持久化存储;将异常图像通过分布式文件服务进行上传。本发明能更加快速的处理大规模数量摄像头的质量诊断,提高整体检测效率,同时能对于服务器资源能根据需要进行动态扩容,提高资源利用率。
-
公开(公告)号:CN119417958A
公开(公告)日:2025-02-11
申请号:CN202411664583.8
申请日:2024-11-20
Applicant: 上海华讯网络系统有限公司
Abstract: 本发明提供了一种基于单目相机的通用3D数字人实时动作捕捉方法及系统,包括:步骤S1:基于单目相机检测3D关键点,并将关键点对齐到统一坐标系下,从视频中检测面部3D地标点,并输出blendshape用于驱动数字人面部;步骤S2:将关键点转换通用驱动数据,将全身骨骼3D关键点坐标转换为对应骨骼的BVH旋转;步骤S3:令低延时平滑数据驱动3D数字人,将面部blendshape参数以及骨骼BVH旋转传输至渲染平台;转换骨骼旋转坐标系到渲染平台的坐标系,驱动3D数字人动作;使用blendshape参数对应控制数字人Morph Target,驱动数字人面部表情。本发明通过对躯干、手部以及面部的ROI区域进行单独检测,提高关键点的检测精度;并且控制数据是一个整体,提高数字人控制的完整度。
-
公开(公告)号:CN119672187A
公开(公告)日:2025-03-21
申请号:CN202411800076.2
申请日:2024-12-09
Applicant: 上海华讯网络系统有限公司
IPC: G06T13/40 , G06T13/20 , G06N3/045 , G06N3/0475 , G06N3/094 , G06V40/16 , G06V20/40 , G10L13/08 , G10L21/10
Abstract: 本发明提供了一种高清数字人的快速唇形合成方法及系统,包括:步骤S1:在用户进行文本输入后,根据文本内容,合成语音内容,保存音频文件,为Wav2Lip唇形合成算法提供语音特征输入;步骤S2:使用Wav2Lip将音频波形转换为面部动画,基于GAN学习音频和图像之间的关系,将音频与静态图像中的人脸进行对齐并合成动态视频;步骤S3:通过VQGAN将人脸复原任务转换为Code序列预测任务,采用Transformer全局建模。本发明应用一种高清数字人的快速唇形合成方法,可以对静态图片或视频进行通用人物的唇形生成,利用提取的语音频谱和检测到人脸序列,合成和语音对应的口型动作。
-
公开(公告)号:CN118261944A
公开(公告)日:2024-06-28
申请号:CN202410569671.3
申请日:2024-05-09
Applicant: 上海华讯网络系统有限公司
Abstract: 本发明提供了一种基于时空域修正的光流场估计和渲染方法及系统,包括:步骤S1:输入视频图像,逐次提取视频上下帧;步骤S2:使用光流估计网络获取视频上下帧的光流位移场;步骤S3:进行时间域采样计算,对每个像素在时域上的历史流速信息进行统计,通过计算历史时间上的流速和流向平均值得到当前帧的流速和流向;步骤S4:进入空间域修正算法步骤,获取图像上每一个像素的流速和流向信息;步骤S5:基于新型流速和流向渲染算法完成对光流场的实时渲染;逐帧提取视频图像,重复步骤S2至步骤S5,进行水流速和流向的实时渲染。本发明使得用户可以直观的感受监测区域的水流实况。
-
-
-