-
公开(公告)号:CN117953090A
公开(公告)日:2024-04-30
申请号:CN202410009434.1
申请日:2024-01-03
Applicant: 北京达佳互联信息技术有限公司
Abstract: 本公开关于一种图像处理方法、装置、电子设备及存储介质,该方法包括:将文本输入文生图模型,得到待修复图像;对所述待修复图像进行裁剪,得到所述人脸区域图像;基于所述人脸区域图像和所述文本,在人脸图像库中检索得到参考图像;将所述参考图像、所述文本和所述人脸区域图像输入所述文生图模型,得到目标人脸图像;以所述目标人脸图像覆盖所述待修复图像中的所述人脸区域图像,得到修复后图像。本公开通过检索参考图像,然后基于参考图像、人脸区域图像和文本等多个不同模态的信息,进行人脸修复,修复后图像在人脸质量提升的同时,还保留了人脸的主要属性。
-
公开(公告)号:CN116887004A
公开(公告)日:2023-10-13
申请号:CN202310898066.6
申请日:2023-07-20
Applicant: 北京达佳互联信息技术有限公司
IPC: H04N21/485
Abstract: 本公开提供了一种视频字幕的译制方法、装置、电子设备及存储介质。译制方法包括:获取目标视频中的多个第一文本及与每个第一文本对应的第二文本;根据所述多个第一文本在目标视频中的显示时段,对各个第一文本的显示区域进行扩展,得到各个第一文本的扩展后显示区域,其中,显示时段重叠的不同第一文本的扩展后显示区域互不重叠;针对每个第一文本,根据第一文本的扩展后显示区域,确定与第一文本对应的第二文本的显示格式,并将目标视频中的第一文本替换为确定的显示格式下的第二文本。根据本公开,能够对视频字幕译制进行时空优化,使得字幕的译文文本在视频中互不重叠、正常显示,进而提升视频字幕的译制质量。
-