-
公开(公告)号:CN118298063A
公开(公告)日:2024-07-05
申请号:CN202410488292.1
申请日:2024-04-22
Applicant: 北京达佳互联信息技术有限公司 , 香港科技大学(广州)
IPC: G06T11/00 , G06F40/211 , G06F40/253 , G06F40/30 , G06F16/583 , G06N3/045 , G06F18/25
Abstract: 本公开是关于一种图像生成方法、装置、电子设备及存储介质,属于计算机技术领域。方法包括:对描述文本进行句法分析,得到至少一个三元组,每个三元组包括描述文本中的三个词语,三元组中的三个词语分别属于主体、关系和客体,关系是指主体和客体之间的关系;对描述文本进行特征提取,得到初始文本特征;分别对至少一个三元组进行特征提取,得到至少一个三元组特征;基于初始文本特征和至少一个三元组特征,生成与描述文本匹配的图像,图像中的内容与描述文本所描述的内容相同。本公开利用三元组的特征能够在图像的生成过程中准确地理解和捕捉描述文本中所描述的各个实体之间的关系,从而提高了基于描述文本生成图像的准确性。
-
公开(公告)号:CN116634120A
公开(公告)日:2023-08-22
申请号:CN202310621514.8
申请日:2023-05-29
Applicant: 北京达佳互联信息技术有限公司
IPC: H04N13/122 , H04N13/128
Abstract: 本公开关于一种图像处理方法、装置、设备及存储介质,涉及互联网技术领域,可以解决重构单目图像时变换角度较小,立体感不强的问题。该图像处理方法,包括:获取单目图像的目标深度图;目标深度图包括:单目图像的多个像素点中,每个像素点的目标深度值;根据每个像素点的目标深度值,确定目标深度图中的深度边缘;根据深度边缘,对目标深度图进行目标处理,得到多层景深对应的多层完整图像;目标处理包括:泛洪处理、深度信息补全和色块填充;一层景深对应一层完整图像;多层景深中,每层景深为目标深度值的预设深度范围;根据多层完整图像和目标视角,渲染单目图像针对目标视角的目标图像;目标视角为任意一个角度。
-
公开(公告)号:CN110751707B
公开(公告)日:2021-02-05
申请号:CN201911017551.8
申请日:2019-10-24
Applicant: 北京达佳互联信息技术有限公司
Abstract: 本公开是关于一种动画显示方法、装置、电子设备及存储介质,其中方法包括:接收针对待显示动画模型的显示指令;获取用户所使用成像设备的空间参数信息;基于成像设备的空间参数信息,确定待显示动画模型在预设空间模型中的初始位置;利用预先生成的待显示动画模型的骨骼动画,在预设空间模型中的初始位置显示待显示动画模型的动画。本公开实施例能够提高用户在观看AR空间模型动画的沉浸感,从而提高用户体验。
-
公开(公告)号:CN119007755A
公开(公告)日:2024-11-22
申请号:CN202410931290.5
申请日:2024-07-11
Applicant: 北京达佳互联信息技术有限公司
Abstract: 本公开关于一种用于驱动数字人的表情系数的生成方法、装置、电子设备及存储介质,所述方法包括:获取用于驱动数字人的音频数据、包括说话风格信息和说话情绪信息的第一控制信息和包括多个模态的控制信息的第二控制信息;通过语音驱动模块对音频数据进行特征提取处理,得到音频特征;通过第一控制模块对第一控制信息进行特征提取处理,得到说话风格特征和说话情绪特征;通过第二控制模块对第二控制信息进行特征提取处理,得到时序文本特征;将音频特征、说话风格特征、说话情绪特征,以及时序文本特征,输入表情系数生成模块进行处理,得到用于驱动数字人的表情系数。该方法能够丰富对数字人的控制方式,得到符合预期且高表现力的驱动结果。
-
公开(公告)号:CN118762120A
公开(公告)日:2024-10-11
申请号:CN202410725886.X
申请日:2024-06-05
Applicant: 北京达佳互联信息技术有限公司
IPC: G06T17/00 , G06V10/54 , G06V40/16 , G06V10/82 , G06N3/0464 , G06N3/0475
Abstract: 本公开关于一种图像处理方法、装置及存储介质。上述方法包括获取包括第一脸部的参考图像和包括第二脸部的第一图像;对参考图像进行纹理特征提取,得到第一脸部对应的参考纹理特征;提取第一脸部对应的中性特征,中性特征为预设头部姿态下无表情的脸部三维关键点特征;提取第二脸部对应的动作状态信息;融合中性特征和第二脸部对应的动作状态信息,得到第一驱动特征;对第一驱动特征进行针对目标部位的重定向处理,得到第二驱动特征,目标部位属于脸部部位;基于第二驱动特征对参考纹理特征进行变形,得到目标纹理特征;基于目标纹理特征,生成第二图像,第二图像具备第一脸部,并且具备第二脸部对应的动作状态信息。本公开提升第二图像的质量。
-
公开(公告)号:CN113643392B
公开(公告)日:2023-12-26
申请号:CN202010393156.6
申请日:2020-05-11
Applicant: 北京达佳互联信息技术有限公司
IPC: G06T11/00 , G06N3/0464 , G06N3/08
Abstract: 本公开提供了一种面部生成模型训练方法、面部图像生成方法及装置,涉及图像处理技术领域,以解决相关技术中面部生成模型生成的面部图像的真实性较差的问题。该方法包括:获取原始正面面部图像和CG侧面面部图像,原始正面面部图像与CG侧面面部图像为同一对象的面部图像;将原始正面面部图像和CG侧面面部图像输入生成网络模型,进行特征提取处理,得到第一生成侧面面部图像;将第一生成侧面面部图像输入判别网络模型,计算第一生成侧面面部图像相对于原始侧面面部图像的对抗损失,原始侧面面部图像为CG侧面面部图像的侧面面部信息对应的原始图像;根据对抗损失,调整生成网络模型的参数,得到面部生成模型。
-
公开(公告)号:CN114332149A
公开(公告)日:2022-04-12
申请号:CN202111607973.8
申请日:2021-12-22
Applicant: 北京达佳互联信息技术有限公司
IPC: G06T7/136 , G06V10/764 , G06K9/62 , G06T5/50
Abstract: 本公开关于一种图像分割方法、装置、电子设备及存储介质,所述方法包括:对待检测图像进行目标检测,得到所述待检测图像中各目标对象对应的候选框和所述候选框的置信信息;所述置信信息用于表示所述候选框中的对象为显著性前景对象的置信概率;根据所述候选框的置信信息,从所述候选框中确定出目标候选框;将所述目标候选框对应的区域图像输入训练完成的图像分割网络,得到分割出的对象图像,作为所述待检测图像的图像分割结果。该方法通过简化显著性检测问题,可以更具有针对性地对图像进行处理,得到更精确的分割结果。
-
公开(公告)号:CN113673546A
公开(公告)日:2021-11-19
申请号:CN202010411825.8
申请日:2020-05-15
Applicant: 北京达佳互联信息技术有限公司
Abstract: 本公开关于一种图像处理方法、装置、电子设备和存储介质,属于图像技术领域。该方法包括:获取待处理图像,对待处理图像中的至少两种分类对象并行进行分类处理,得到待处理图像中每种分类对象的分类结果,其中,对待处理图像中的至少一种目标分类对象并行进行多分类级别的分类处理,输出待处理图像中各分类对象的分类结果,其中,输出的每种目标分类对象的分类结果根据该目标分类对象的不同分类级别的分类结果确定。这样,对待处理图像中的至少两种分类对象并行进行分类处理,分类速度比较快,并且,综合每种目标分类对象的不同分类级别的分类结果确定输出的该种目标分类对象的分类结果,还可提升对目标分类对象的分类准确度。
-
公开(公告)号:CN113643392A
公开(公告)日:2021-11-12
申请号:CN202010393156.6
申请日:2020-05-11
Applicant: 北京达佳互联信息技术有限公司
Abstract: 本公开提供了一种面部生成模型训练方法、面部图像生成方法及装置,涉及图像处理技术领域,以解决相关技术中面部生成模型生成的面部图像的真实性较差的问题。该方法包括:获取原始正面面部图像和CG侧面面部图像,原始正面面部图像与CG侧面面部图像为同一对象的面部图像;将原始正面面部图像和CG侧面面部图像输入生成网络模型,进行特征提取处理,得到第一生成侧面面部图像;将第一生成侧面面部图像输入判别网络模型,计算第一生成侧面面部图像相对于原始侧面面部图像的对抗损失,原始侧面面部图像为CG侧面面部图像的侧面面部信息对应的原始图像;根据对抗损失,调整生成网络模型的参数,得到面部生成模型。
-
公开(公告)号:CN110264505B
公开(公告)日:2021-07-30
申请号:CN201910486072.4
申请日:2019-06-05
Applicant: 北京达佳互联信息技术有限公司
IPC: G06T7/50
Abstract: 本公开关于一种单目深度估计方法、装置、电子设备及存储介质。该方法中,利用深度估计模型对单目视频的视频帧进行深度估计;该深度估计模型,基于预设样本帧、预设样本帧对应的对抗样本帧以及预设样本帧的标注深度数据训练获得;在训练时,基于预设样本帧的估计深度数据和所对应对抗样本帧的估计深度数据之间的差异,预设样本帧的标注深度数据和估计深度数据之间的差异,判断训练中的深度估计模型是否收敛;如果收敛,完成训练;其中,对抗样本帧为:对预设样本帧进行数据增广处理得到的样本帧。本公开可以在保证准确性的前提下,有效抑制单目深度估计结果中的抖动,且省去了对视频帧进行滤波平滑处理所引入的计算量。
-
-
-
-
-
-
-
-
-