-
公开(公告)号:CN114092381B
公开(公告)日:2025-03-04
申请号:CN202010789367.1
申请日:2020-08-07
Applicant: 北京达佳互联信息技术有限公司
Abstract: 本公开关于光照方向确定方法、装置、电子设备及存储介质,所述方法包括:通过多个下采样神经网络依次对待处理图像进行下采样,得到待转换图像;通过通道转换神经网络对待转换图像进行通道转换,得到转换后图像;对转换后图像进行矩阵变换,得到目标图像;根据目标图像中像素的亮度在目标图像中确定光源对应的光源像素;根据每个光源像素指向目标图像中心的向量,计算待处理图像中光源的光照方向。根据本公开,将待处理图像的特征表达在目标图像中,实现通过目标图像准确地对待处理图像光照的特征进行表达,进而根据目标直接准确地确定待处理图像中的光照方向,所应用模型简单,计算速度快,适用于在手机等计算能力不强的设备上使用。
-
公开(公告)号:CN119418383A
公开(公告)日:2025-02-11
申请号:CN202411545849.7
申请日:2024-10-31
Applicant: 北京达佳互联信息技术有限公司
IPC: G06V40/16 , G06V10/774 , G06V10/80 , G06N3/0464 , G06N3/0455 , G06N3/08
Abstract: 本申请实施例公开了一种表情驱动模型的训练方法、表情驱动方法及对应装置。主要技术方案包括:获取包括多个第一训练样本的第一训练数据,所述第一训练样本至少包括:音频样本、与所述音频样本对应的表情控制数据以及表情参数真值,所述表情控制数据至少包括时序控制数据,所述时序控制数据包括所述音频样本的时序内至少一个时间窗口对应的动作类型序列;基于所述第一训练数据训练表情驱动模型,包括:将所述音频样本和与所述音频样本对应的表情控制参数作为所述表情驱动模型的输入,获取所述表情驱动模型输出的表情参数序列。本申请可以提高面部表情的精细化控制效果,使其表情变化更加丰富和生动。
-
公开(公告)号:CN114170349B
公开(公告)日:2024-12-20
申请号:CN202010947268.1
申请日:2020-09-10
Applicant: 北京达佳互联信息技术有限公司
Abstract: 本公开提供了一种图像生成方法、装置、电子设备及存储介质,涉及图像处理技术领域。方法包括:确定第一图像中第一图像区域的第一深度信息和第二图像区域的第二深度信息,第一图像区域为目标对象所在的图像区域,第二图像区域为除目标对象以外的背景图像所在的区域;根据第二图像区域的图像数据,替换第一图像区域的图像数据,得到第二图像;对第二图像中的第三图像区域进行深度填充,得到第三图像区域的第三深度信息;根据第一深度信息和第三深度信息,将第一图像区域中的图像数据融合至深度填充后的第二图像中,得到第三图像。这样,在视角变换时,能够填补背景空洞的,防止目标对象的边界处出现扭曲或缺失,优化生成的三维图像的图像效果。
-
公开(公告)号:CN113643343B
公开(公告)日:2024-05-17
申请号:CN202010346542.X
申请日:2020-04-27
Applicant: 北京达佳互联信息技术有限公司
IPC: G06T7/50 , G06N3/08 , G06N3/0464
Abstract: 本公开关于一种深度估计模型的训练方法、装置、电子设备及存储介质,以至少解决卷积神经网络对视频图像深度估计的稳定性不高的问题。该方法包括:将n个样本图像以及与n个样本图像一一对应的n个模拟图像分别输入预设深度估计模型,得到分别对应n个样本图像的深度预测结果和n个模拟图像的深度预测结果;n个样本图像和n个模拟图像标注有像素点深度值;根据每个样本图像的像素点深度值和每个样本图像的深度预测结果获得n个第一损失;根据每个样本图像的深度预测结果和与每个样本图像对应的模拟图像的深度预测结果获得n个第二损失;根据n个第一损失和n个第二损失,训练预设深度估计模型,得到第一目标深度估计模型。
-
公开(公告)号:CN113673546B
公开(公告)日:2024-04-16
申请号:CN202010411825.8
申请日:2020-05-15
Applicant: 北京达佳互联信息技术有限公司
IPC: G06V10/764 , G06V10/32 , G06T3/40
Abstract: 本公开关于一种图像处理方法、装置、电子设备和存储介质,属于图像技术领域。该方法包括:获取待处理图像,对待处理图像中的至少两种分类对象并行进行分类处理,得到待处理图像中每种分类对象的分类结果,其中,对待处理图像中的至少一种目标分类对象并行进行多分类级别的分类处理,输出待处理图像中各分类对象的分类结果,其中,输出的每种目标分类对象的分类结果根据该目标分类对象的不同分类级别的分类结果确定。这样,对待处理图像中的至少两种分类对象并行进行分类处理,分类速度比较快,并且,综合每种目标分类对象的不同分类级别的分类结果确定输出的该种目标分类对象的分类结果,还可提升对目标分类对象的分类准确度。
-
公开(公告)号:CN117834935A
公开(公告)日:2024-04-05
申请号:CN202410010314.3
申请日:2024-01-02
Applicant: 北京达佳互联信息技术有限公司
IPC: H04N21/2187 , H04N21/4788 , G10L15/06 , G10L17/04 , G10L15/183 , G10L15/25 , G10L15/16 , H04N21/44 , H04N21/845
Abstract: 本申请实施例公开了一种数字人直播方法、装置、电子设备及存储介质,涉及计算机技术领域。该数字人直播方法包括:在根据播放序列进行数字人直播的过程中,实时采集观众客户端发起的问题信息;该播放序列包括至少两个播放时间区间连续的播放片段;确定问题信息对应的答案信息和该答案信息的生成时间;从播放片段中确定出与该生成时间对应的第一播放片段;该生成时间处于第一播放片段的播放时间区间内;根据第一播放片段在播放序列中的序列位置,将答案信息插入至播放序列后,并将处理后的播放序列推流至观众客户端。采用本申请实施例,能够在数字人直播过程中,与观众客户端进行实时交互。
-
公开(公告)号:CN114677426A
公开(公告)日:2022-06-28
申请号:CN202210345732.9
申请日:2022-04-02
Applicant: 北京达佳互联信息技术有限公司
Abstract: 本公开关于一种图像处理方法、装置、电子设备及存储介质,所述方法包括:获取待处理图像对应的深度图,从深度图中确定出前景对象的第一边缘和背景对象的第二边缘;在深度图中对第一边缘的第一方向和第二边缘的第二方向分别进行第一泛洪处理,得到第一边缘泛洪后形成的前景区域和第二边缘泛洪后形成的已知背景区域,并基于前景区域确定遮挡区域;其中,遮挡区域表示被前景区域遮挡的背景区域;第一方向与第二方向相反;在深度图中通过已知背景区域对遮挡区域进行深度信息补全和RGB信息补全处理,得到遮挡区域对应的补全背景图像。本方法可准确地对图像的断层区域附近的像素点进行深度信息补全和RGB信息补全,得到更为清晰、合理的补全结果。
-
公开(公告)号:CN109948689B
公开(公告)日:2022-06-03
申请号:CN201910190595.4
申请日:2019-03-13
Applicant: 北京达佳互联信息技术有限公司
Abstract: 本申请是关于一种视频生成方法、装置、电子设备及存储介质,其中,该方法包括:获取对待处理图像进行深度估计得到的每个像素点的深度距离值和待处理图像中每个像素点的像素坐标值;根据每个像素点的像素坐标值和该像素点的深度距离值,计算每个像素点的相机坐标值;获取预先对待处理图像设置的多个相机坐标改变值;根据每个相机坐标改变值和每个像素点的相机坐标值,重构按照该相机坐标改变值改变后的图像;根据按照多个相机坐标改变值重构的多个图像,生成与多个图像对应的视频。从而使得生成的视频具有立体效果,提高生成的视频的观赏性。
-
公开(公告)号:CN114170349A
公开(公告)日:2022-03-11
申请号:CN202010947268.1
申请日:2020-09-10
Applicant: 北京达佳互联信息技术有限公司
Abstract: 本公开提供了一种图像生成方法、装置、电子设备及存储介质,涉及图像处理技术领域。方法包括:确定第一图像中第一图像区域的第一深度信息和第二图像区域的第二深度信息,第一图像区域为目标对象所在的图像区域,第二图像区域为除目标对象以外的背景图像所在的区域;根据第二图像区域的图像数据,替换第一图像区域的图像数据,得到第二图像;对第二图像中的第三图像区域进行深度填充,得到第三图像区域的第三深度信息;根据第一深度信息和第三深度信息,将第一图像区域中的图像数据融合至深度填充后的第二图像中,得到第三图像。这样,在视角变换时,能够填补背景空洞的,防止目标对象的边界处出现扭曲或缺失,优化生成的三维图像的图像效果。
-
公开(公告)号:CN110400337B
公开(公告)日:2021-10-26
申请号:CN201910618669.X
申请日:2019-07-10
Applicant: 北京达佳互联信息技术有限公司
IPC: G06T7/50
Abstract: 本申请是关于一种图像处理方法、装置、电子设备及存储介质,获取待处理图像的每个像素的深度信息;根据所述深度信息和所述像素在图像坐标系中的二维位置,获得所述像素在图像采集装置坐标系中的像素三维位置;获取视角参数,以及对焦点的对焦三维位置;其中,视角参数为与待处理图像对应的固定观察视角不同的视角的参数;根据所述对焦三维位置、所述视角参数以及所述像素三维位置,获得所述像素的偏移后的三维位置;分别根据每个像素的所述偏移后的三维位置,将每个像素投影至待处理图像的二维坐标系中,得到目标图像。通过本方案能够实现待处理图像中的场景具有不同的观察视角所对应的不同展示效果。
-
-
-
-
-
-
-
-
-