-
公开(公告)号:CN112818995B
公开(公告)日:2024-05-21
申请号:CN202110111742.1
申请日:2021-01-27
Applicant: 北京达佳互联信息技术有限公司
IPC: G06V10/26 , G06V10/40 , G06V10/74 , G06V10/774 , G06V10/764 , G06V10/80
Abstract: 本公开关于一种图像分类方法、装置及电子设备,该图像分类方法包括获取待分类图像的分割特征图像和场景信息;将分割特征图像输入目标图像分类网络进行分类处理,得到初始类别信息;基于场景信息和初始类别信息,生成目标拼接特征信息;将目标拼接特征信息输入目标生成网络进行图像合成处理,得到目标合成图像;对目标合成图像和分割特征图像进行融合处理,得到目标融合特征图像;将目标融合特征图像输入目标图像分类网络进行分类处理,得到待分类图像的第一目标类别信息。利用本公开实施例可以提升图像分类精度,降低出错率。
-
公开(公告)号:CN115331062B
公开(公告)日:2023-08-08
申请号:CN202211040568.7
申请日:2022-08-29
Applicant: 北京达佳互联信息技术有限公司
IPC: G06V10/764 , G06V10/74 , G06V10/82 , G06F16/583 , G06N3/08
Abstract: 本公开关于一种图像识别方法、装置、电子设备和计算机可读存储介质,图像识别方法包括:获取待识别图像;利用图像识别模型的特征提取网络,提取待识别图像的图像特征向量,将图像特征向量按照预设比例分割为第一特征向量和第二特征向量;将第一特征向量输入图像识别模型的分类网络,得到候选预估类别及其预估概率;在预估概率小于概率阈值的情况下,获取多个预先配置的携带有类别标签的检索特征向量;根据第二特征向量和检索特征向量,确定预估类别。本公开能够较好地结合图像分类的基于大数据统计的归纳推理能力和图像检索的局部泛化能力,提升图像识别模型整体识别效果。
-
公开(公告)号:CN116156247A
公开(公告)日:2023-05-23
申请号:CN202310124901.0
申请日:2023-02-03
Applicant: 北京达佳互联信息技术有限公司
IPC: H04N21/44 , H04N21/4402 , H04N21/435 , G06F18/241 , G06F18/214
Abstract: 本公开关于一种视频处理方法、装置、电子设备及存储介质,所述方法包括:获取待处理视频中出现的多个文本信息;确定各个文本信息在所述待处理视频中的文本布局信息;将所述待处理视频包含的各个视频帧、所述各个文本信息以及所述各个文本信息的文本布局信息,输入训练完成的属性分类模型进行分类处理,得到所述待处理视频中的每个文本信息对应的功能属性和来源属性;所述功能属性用于表征每个文本信息的类型,所述来源属性用于表征所述文本信息的来源。该方法通过融合视频中文本的视觉、位置和文本等多种模态的信息,来实现对视频中文本的多个角度多个层次的分析的方法,可以显著提高对视频内容理解的准确度。
-
公开(公告)号:CN115578587A
公开(公告)日:2023-01-06
申请号:CN202211243002.4
申请日:2022-10-11
Applicant: 北京达佳互联信息技术有限公司
IPC: G06V10/764 , G06N3/04 , G06N3/08 , G06V10/774 , G06V10/82
Abstract: 本公开是关于一种图像处理模型的训练方法、装置、电子设备及存储介质,涉及图像处理技术领域,该方法包括:将待训练图像样本对应增广待训练图像样本进行特征提取;根据提取的特征向量进行损失处理,得到每个待训练图像样本对应的第一、第二增广待训练图像样本对应的第一分类损失、第二分类损失,以及第一、第二增广待训练图像样本对应的比对损失;根据第一分类损失、第二分类损失以及对比损失,确定每个待训练图像样本所属样本类型;基于课程学习算法,将待训练图像样本,按照所属样本类型从简单、中等困难到困难的顺序,对初始图像分类模型进行迭代训练得到目标图像分类模型。本公开能够解决图像处理模型受噪声样本影响训练效果的问题。
-
公开(公告)号:CN113989703A
公开(公告)日:2022-01-28
申请号:CN202111210643.5
申请日:2021-10-18
Applicant: 北京达佳互联信息技术有限公司
Abstract: 本公开提供媒体资源标注方法、装置、设备及存储介质,涉及数据处理技术领域,以解决媒体资源标注消耗大量人力成本问题。该方法包括:获取待标注媒体资源中至少两个采样媒体资源帧的初始标注信息;对于每一采样媒体资源帧从至少两个采样媒体资源帧中确定相似采样媒体资源帧;对每一采样媒体资源帧的中对象的初始标注信息和各自对应的相似采样媒体资源帧中对象的初始标注信息进行同化处理得到每个采样媒体资源帧中对象的目标标注信息;基于每个采样媒体资源帧中对象的目标标注信息确定每两个相邻采样媒体资源帧之间的非采样媒体资源中对象的标注信息;将所有目标标注信息和非采样媒体资源中对象的标注信息作为待标注媒体资源中对象的标注信息。
-
公开(公告)号:CN112434178A
公开(公告)日:2021-03-02
申请号:CN202011325685.9
申请日:2020-11-23
Applicant: 北京达佳互联信息技术有限公司
Abstract: 本申请公开了一种图像分类方法、装置、电子设备和存储介质。用于解决由于相关技术中采用单一模型对图像进行检测,导致召回率和准确率较低的问题。本申请实施例中,首先获取目标图像;对目标图像进行特征提取,得到目标图像的第一图像特征;其次,采用目标图像的第一图像特征,确定目标图像属于目标类别的第一概率;当第一概率高于第一概率阈值时,从目标图像中提取第二图像特征,并获取目标图像关联的目标对象的用户特征;采用决策树对第二图像特征和用户特征进行融合处理,得到目标图像属于目标类别的第二概率;当第二概率高于第二概率阈值时,确定目标对象属于所述目标类别。
-
公开(公告)号:CN112364933A
公开(公告)日:2021-02-12
申请号:CN202011322350.1
申请日:2020-11-23
Applicant: 北京达佳互联信息技术有限公司
Abstract: 本申请公开了一种图像分类方法、装置、电子设备和存储介质,用于解决相关技术中分类精度有所提升,但时间消耗也大幅增加的问题。本申请中对目标图像的特征图进行裁剪处理得到多张特征子图,并提取特征子图之间的交互关系后,基于包含交互关系的特征信息进行分类识别。由于提取特征子图的关联关系的方法在时间消耗上远远小于从原始图像裁剪出的部分的分类处理,故此,本申请的图像分类方法能够节约时间消耗。此外,由于对特征图的裁剪和提取出不同特征子图关联关系,使得分类精度相较于整图识别的方式有所提升。故此,本申请实施例的图像分类方法是一种从时间消耗和精度上进行权衡后的一个较佳方法。
-
公开(公告)号:CN112766407B
公开(公告)日:2023-12-05
申请号:CN202110127057.8
申请日:2021-01-29
Applicant: 北京达佳互联信息技术有限公司
IPC: G06V10/764 , G06V10/44 , G06V10/80 , G06V10/82 , G06V20/40 , G06N3/0464 , G06N3/045 , G06N3/08
Abstract: 本申请公开了一种图像识别方法、装置及存储介质,涉及图像处理领域,以提高图像识别的准确率。该方法中,通过对图像进行特征识别,得到图像的全局特征和多个局部特征,并对获取的所有特征整合成为一个图像特征,根据图像特征进行分类,获取分类结果。这样,通过局部特征与全局特征的有效融合,保证了信息的有效利用,从而使分类结果更加准确。
-
公开(公告)号:CN115331062A
公开(公告)日:2022-11-11
申请号:CN202211040568.7
申请日:2022-08-29
Applicant: 北京达佳互联信息技术有限公司
IPC: G06V10/764 , G06V10/74 , G06V10/82 , G06F16/583 , G06N3/08
Abstract: 本公开关于一种图像识别方法、装置、电子设备和计算机可读存储介质,图像识别方法包括:获取待识别图像;利用图像识别模型的特征提取网络,提取待识别图像的图像特征向量,将图像特征向量按照预设比例分割为第一特征向量和第二特征向量;将第一特征向量输入图像识别模型的分类网络,得到候选预估类别及其预估概率;在预估概率小于概率阈值的情况下,获取多个预先配置的携带有类别标签的检索特征向量;根据第二特征向量和检索特征向量,确定预估类别。本公开能够较好地结合图像分类的基于大数据统计的归纳推理能力和图像检索的局部泛化能力,提升图像识别模型整体识别效果。
-
公开(公告)号:CN114332698A
公开(公告)日:2022-04-12
申请号:CN202111597161.X
申请日:2021-12-24
Applicant: 北京达佳互联信息技术有限公司
IPC: G06V20/40 , G06V10/764 , G06K9/62
Abstract: 本公开关于一种多媒体资源标注监控方法、装置、电子设备及存储介质,多媒体资源标注监控方法包括:获取待监控的多媒体资源、对多媒体资源执行标注任务的标注对象对应的对象信息;确定多媒体资源的内容特征,并根据对象信息确定标注对象对应的对象特征;将内容特征和对象特征进行融合,得到融合特征;基于融合特征,确定监控结果,其中,监控结果用于表征多媒体资源被标注错误的预测概率。本公开将多媒体资源的内容特征和标注对象的对象特征相融合得到融合特征,使得融合特征将多媒体资源与标注对象相联系,实现了对多媒体资源标注准确率的预测,实现了对标注对象可能出现标注错误的端对端提醒。
-
-
-
-
-
-
-
-
-