-
公开(公告)号:CN115994974A
公开(公告)日:2023-04-21
申请号:CN202310003052.3
申请日:2023-01-03
Applicant: 清华大学 , 北京达佳互联信息技术有限公司
Abstract: 本公开关于一种场景渲染方法、装置、电子设备及存储介质,该方法包括:获取待渲染场景,以及获取进行场景渲染时虚拟目标所在的位置坐标;从所述待渲染场景的预计算结果中,获取所述位置坐标对应的可见的物体,一个物体对应一个位置坐标可见表征该位置坐标发出的光线与该物体相交,和/或该位置坐标发出的光线经过投射后与该物体相交;对所述可见的物体进行渲染,得到所述位置坐标对应的渲染后的场景。本公开中,可见的物体包括与光线和/或该光线经过投射后的光线相交的物体,实现了将本身可见的物体和/或阴影可见的物体,都确定为可见的物体,避免了错误地将仅有阴影可见的物体进行剔除,导致渲染结果不真实的缺点。
-
公开(公告)号:CN112818995A
公开(公告)日:2021-05-18
申请号:CN202110111742.1
申请日:2021-01-27
Applicant: 北京达佳互联信息技术有限公司
Abstract: 本公开关于一种图像分类方法、装置及电子设备,该图像分类方法包括获取待分类图像的分割特征图像和场景信息;将分割特征图像输入目标图像分类网络进行分类处理,得到初始类别信息;基于场景信息和初始类别信息,生成目标拼接特征信息;将目标拼接特征信息输入目标生成网络进行图像合成处理,得到目标合成图像;对目标合成图像和分割特征图像进行融合处理,得到目标融合特征图像;将目标融合特征图像输入目标图像分类网络进行分类处理,得到待分类图像的第一目标类别信息。利用本公开实施例可以提升图像分类精度,降低出错率。
-
公开(公告)号:CN113965803B
公开(公告)日:2024-02-06
申请号:CN202111052370.6
申请日:2021-09-08
Applicant: 北京达佳互联信息技术有限公司
Abstract: 本公开关于一种视频数据处理方法、装置、电子设备、存储介质。所述方法包括:根据待检测视频中的待检测图像帧从视频数据库中确定第一相似视频;从多个数据采集维度获取与待检测视频对应的待检测数据,对待检测数据进行特征提取,得到待检测视频的待检测多模特征;根据待检测多模特征从视频数据库中确定第二相似视频;根据第一相似视频的第一视频标签,以及第二相似视频的第二视频标签,确定待检测视频的目标视频标签。该方法通过多路结合的召回策略,不仅可以提升确定视频标签的准确性,还可以提升视频标签的召回能力。
-
公开(公告)号:CN117131218A
公开(公告)日:2023-11-28
申请号:CN202310987029.2
申请日:2023-08-07
Applicant: 清华大学 , 北京达佳互联信息技术有限公司
IPC: G06F16/54 , G06F16/55 , G06F16/583 , G06V10/764 , G06V10/26 , G06V20/70
Abstract: 本发明提出了对多种计算机视觉任务统一分析的可视分析系统和方法,该方法包括:接收多个包含至少一个对象的图片、每个图片中对象的标注结果及每个图片中对象层面的模型预测结果,其中标注结果以及模型预测结果均包括对象层面的检测分类结果和对象层面的检测位置结果或每个图片中对象层面的分割分类结果和对象层面的分割位置结果,检测分类结果和分割分类结果包括离散属性的离散值,检测位置结果和分割位置结果包括连续属性的连续值;根据每个图片中对象的标注结果以及每个图片中对象层面的模型预测结果,利用联合概率分布对结果中的离散属性和连续属性统一建模,从而得到多元概率分布;以及对多元概率分布进行多层次的显示。
-
公开(公告)号:CN115205609A
公开(公告)日:2022-10-18
申请号:CN202110324871.9
申请日:2021-03-26
Applicant: 北京达佳互联信息技术有限公司
IPC: G06V10/774 , G06N20/00
Abstract: 本公开关于一种图像识别模型训练方法、图像识别方法、装置及电子设备,该图像识别模型训练方法包括:获取图像集,将图像集输入预设机器学习模型,得到每张图像的预测样本属性信息,利用每张图像对应的标注样本属性信息和预测样本属性信息对预设机器学习模型进行训练,可以得到拥有初步识别能力的初始图像识别模型。根据每张图像对应的标注样本属性信息和预测样本属性信息从图像集中确定出目标图像集,从而删除掉某些对训练过程产生不利影响的非目标图像,进而利用目标图像集对初始图像识别模型进行训练,得到目标图像识别模型,如此,使得训练得到的目标图像识别模型更能专注于重点关注的图像的识别,提高模型的正确率和召回能力。
-
公开(公告)号:CN112818995B
公开(公告)日:2024-05-21
申请号:CN202110111742.1
申请日:2021-01-27
Applicant: 北京达佳互联信息技术有限公司
IPC: G06V10/26 , G06V10/40 , G06V10/74 , G06V10/774 , G06V10/764 , G06V10/80
Abstract: 本公开关于一种图像分类方法、装置及电子设备,该图像分类方法包括获取待分类图像的分割特征图像和场景信息;将分割特征图像输入目标图像分类网络进行分类处理,得到初始类别信息;基于场景信息和初始类别信息,生成目标拼接特征信息;将目标拼接特征信息输入目标生成网络进行图像合成处理,得到目标合成图像;对目标合成图像和分割特征图像进行融合处理,得到目标融合特征图像;将目标融合特征图像输入目标图像分类网络进行分类处理,得到待分类图像的第一目标类别信息。利用本公开实施例可以提升图像分类精度,降低出错率。
-
公开(公告)号:CN115797723B
公开(公告)日:2023-10-13
申请号:CN202211507244.X
申请日:2022-11-29
Applicant: 北京达佳互联信息技术有限公司
IPC: G06V10/774 , G06V10/82
Abstract: 本公开关于一种滤镜推荐方法、装置、电子设备及存储介质,涉及计算机技术领域。本公开用以推荐满足用户需求的滤镜。该方法包括:获取当前对象的对象特征、目标作品的内容特征以及待推荐滤镜的滤镜特征;基于对象特征、内容特征以及滤镜特征,确定当前对象对待推荐滤镜的偏好程度;根据偏好程度,确定待推荐滤镜在滤镜推荐列表中的位置,从而使得本公开可以推荐出更符合对象需求的滤镜。
-
公开(公告)号:CN115239860B
公开(公告)日:2023-08-01
申请号:CN202211068017.1
申请日:2022-09-01
Applicant: 北京达佳互联信息技术有限公司
Abstract: 本公开是关于一种表情数据生成方法、装置、电子设备及存储介质,属于计算机技术领域。方法包括:确定多个第一网格顶点的顶点数据和多个第二网格顶点的顶点数据;基于多个第一网格顶点的顶点数据进行图卷积,得到多个第一顶点特征,基于多个第二网格顶点的顶点数据进行图卷积,得到多个第二顶点特征;基于多个第一顶点特征和多个第二顶点特征,检测多个第一网格顶点中的第一关键点和多个第二网格顶点中的第二关键点;基于第一关键点的顶点数据以及第二关键点的顶点数据,对多个第二网格顶点中的非关键点的顶点数据进行调整,将调整后的多个第二网格顶点的顶点数据构成表情数据。本公开提供的表情数据生成方法,操作简单方便,且准确性较高。
-
公开(公告)号:CN113965803A
公开(公告)日:2022-01-21
申请号:CN202111052370.6
申请日:2021-09-08
Applicant: 北京达佳互联信息技术有限公司
Abstract: 本公开关于一种视频数据处理方法、装置、电子设备、存储介质。所述方法包括:根据待检测视频中的待检测图像帧从视频数据库中确定第一相似视频;从多个数据采集维度获取与待检测视频对应的待检测数据,对待检测数据进行特征提取,得到待检测视频的待检测多模特征;根据待检测多模特征从视频数据库中确定第二相似视频;根据第一相似视频的第一视频标签,以及第二相似视频的第二视频标签,确定待检测视频的目标视频标签。该方法通过多路结合的召回策略,不仅可以提升确定视频标签的准确性,还可以提升视频标签的召回能力。
-
公开(公告)号:CN113035202A
公开(公告)日:2021-06-25
申请号:CN202110122528.6
申请日:2021-01-28
Applicant: 北京达佳互联信息技术有限公司
Abstract: 本公开关于一种身份识别方法和装置,该方法包括:在对可疑音视频信息检测时,可以从可疑音视频信息中获取待识别音频信息,将待识别音频信息输入到声纹特征确定模型中进行声纹特征提取,得到待视频音频信息中发声对象的声纹特征。将待视频音频信息中发声对象的声纹特征和预存储的注册声纹特征输入到声纹特征匹配模型中进行声纹特征匹配,将获取到的注册声纹特征对应的发声对象的身份信息作为待识别音频信息中发声对象的身份识别结果。该方法可以基于声纹特征确定模型和声纹特征匹配模型确定待识别音频信息中发声对象的身份信息,提高身份识别的效率和准确性,从而减少人力成本。
-
-
-
-
-
-
-
-
-