-
公开(公告)号:CN118972667B
公开(公告)日:2024-12-13
申请号:CN202411432446.1
申请日:2024-10-14
Applicant: 湘江实验室
IPC: H04N21/4402 , G06N20/00 , H04N7/01
Abstract: 本发明实施例中提供了一种基于深度强化学习的视频插帧任务调度方法,属于数据处理技术领域,具体包括:步骤1,对视频数据进行解码得到不同视频帧组并进行插帧算法类型划分,得到视频帧组特征信息向量;步骤2,获得算力设备性能指标向量;步骤3,基于视频帧组特征信息向量和算力设备性能指标向量,采用强化学习对不同视频帧组分配算力设备;步骤4,从各算力设备得到插帧结果,将插帧结果插入视频帧之间,得到完整插帧视频组,对其进行编码操作,得到插帧视频数据。通过本发明的方案,提高了任务调度的效率、精准度和适应性。
-
公开(公告)号:CN119854541A
公开(公告)日:2025-04-18
申请号:CN202510228758.9
申请日:2025-02-28
Applicant: 湘江实验室
IPC: H04N21/234 , H04N21/2343 , H04N21/44 , H04N21/4402 , G06T5/70 , G06N3/0455 , G06N3/0464 , G06N3/08 , G06T5/60 , G06T7/73
Abstract: 本发明公开了一种人物视频生成方法、装置、计算机设备及存储介质,包括:对原始人物视频进行解码,得到若干图像帧,并将每个图像帧映射到二维图像上,得到初始人物姿态序列图;获取初始人物姿态序列图中的每个图像帧确定时间位置信息,得到时间位置编码向量,并将初始人物姿态序列图与时间位置编码向量进行拼接融合,得到目标人物姿态序列图;基于目标人物姿态序列图中每个图像帧,确定噪音特征;将噪音特征输入到快速去噪扩散模型,生成图像帧对应的新的人物图像特征,作为目标图像特征;对得到的每个目标图像特征进行解码,得到目标人物视频。采用本发明提高生成人物视频的清晰流畅度。
-
公开(公告)号:CN119314212A
公开(公告)日:2025-01-14
申请号:CN202411334972.4
申请日:2024-09-24
Applicant: 湘江实验室
IPC: G06V40/16 , G06V20/40 , G06V10/80 , G06V10/774 , G06V10/82 , G06V10/764 , G06T3/02 , G06T3/4038 , G06T3/4046
Abstract: 本发明公开了一种说话人脸生成方法、装置、计算机设备及存储介质,包括:获取说话人视频,并从说话人视频中选取参考图像序列集;基于参考图像序列集进行多模态特征提取,得到人脸多样化特征;对每种人脸多样化特征进行映射拼接,得到多模态融合特征;基于多模态融合特征构建生成仿射变化参数,并采用仿射变化参数对人脸多样化特征进行仿射变化,得到深度变形特征;对多模态融合特征和深度变形特征进行跨模态注意力计算,自适应生成深度变形特征对应的注意力权重,得到增强变形融合特征;将增强变形融合特征、人脸一致性特征和表情特征进行解码,得到特定时刻带有表情的说话人脸图像。采用本发明提高了说话人脸图片生成质量与泛化能力。
-
公开(公告)号:CN118972667A
公开(公告)日:2024-11-15
申请号:CN202411432446.1
申请日:2024-10-14
Applicant: 湘江实验室
IPC: H04N21/4402 , G06N20/00 , H04N7/01
Abstract: 本发明实施例中提供了一种基于深度强化学习的视频插帧任务调度方法,属于数据处理技术领域,具体包括:步骤1,对视频数据进行解码得到不同视频帧组并进行插帧算法类型划分,得到视频帧组特征信息向量;步骤2,获得算力设备性能指标向量;步骤3,基于视频帧组特征信息向量和算力设备性能指标向量,采用强化学习对不同视频帧组分配算力设备;步骤4,从各算力设备得到插帧结果,将插帧结果插入视频帧之间,得到完整插帧视频组,对其进行编码操作,得到插帧视频数据。通过本发明的方案,提高了任务调度的效率、精准度和适应性。
-
-
-