-
公开(公告)号:CN110175653A
公开(公告)日:2019-08-27
申请号:CN201910459369.1
申请日:2019-05-29
Applicant: 北京达佳互联信息技术有限公司
IPC: G06K9/62
Abstract: 本公开是关于一种图像识别的方法、装置、设备及存储介质,方法包括:获取识别模型,基于识别模型对目标训练数据集中的训练数据进行识别,得到每一个训练数据的识别结果,将识别结果作为训练数据的标签;在目标训练数据集中,获取满足目标条件的训练数据;基于满足目标条件的训练数据训练识别模型,得到更新后的识别模型;基于更新后的识别模型对目标训练数据集中的训练数据进行识别,得到每一个训练数据的识别结果;根据识别结果更新训练数据的标签,得到更新后的目标训练数据集,将更新后的目标训练数据集中的训练数据作为用于训练机器学习模型的训练数据,利用基于目标训练数据集中的训练数据训练得到的目标识别物的识别模型进行图像识别。
-
公开(公告)号:CN109886211A
公开(公告)日:2019-06-14
申请号:CN201910138614.9
申请日:2019-02-25
Applicant: 北京达佳互联信息技术有限公司
Abstract: 本公开是关于一种数据标注方法、装置、电子设备及存储介质,所述方法包括:将样本数据的样本标签与分类模型对样本数据重新添加的第一输出标签进行匹配,基于匹配结果调整分类模型,并且基于分类模型输出的待标注数据的第一候选标签与调整后的分类模型输出的待标注数据的第二候选标签的匹配结果,对待标注数据添加标签。可见,在本方案中,通过调整分类模型,使用更准确的分类模型对待标注数据进行标注,相比于人工标注,减少了数据标注成本。
-
公开(公告)号:CN111428806B
公开(公告)日:2023-10-10
申请号:CN202010258265.7
申请日:2020-04-03
Applicant: 北京达佳互联信息技术有限公司
IPC: G06V10/84
Abstract: 本公开关于一种图像标签确定方法、装置、电子设备及存储介质。该图像标签确定方法包括:将目标图像输入预设的至少一个图像标签预测模型,得到至少一个预测结果;对至少一个预测结果进行筛选,确定出至少一个目标预测结果;对至少一个目标预测结果中的预测概率进行校验,得到图像校验预测概率和对应的图像校验预测标签;将满足预设条件的图像校验预测概率对应的图像校验预测标签,确定为目标图像的标签。其中,对至少一个目标预测结果进行多重校验,根据多重校验结果来确定图像的标签,能够避免应用单一模型进行标签确定的不确定性,提高真实场景中对目标图像的标签进行识别的精度。
-
公开(公告)号:CN111538859A
公开(公告)日:2020-08-14
申请号:CN202010329061.8
申请日:2020-04-23
Applicant: 北京达佳互联信息技术有限公司
Abstract: 本发明提供一种动态更新视频标签的方法、装置及电子设备,该方法包括:接收平台账户上传的待标注视频数据,从平台账户之前上传的视频数据中,获取标签视频数据集合外的缓冲视频数据,标签视频数据集合包括至少一个标注视频标签的标签视频数据;采用分类算法对待标注视频数据及缓冲视频数据进行分类,根据分类结果确定触发视频标签更新时,确定各分类相对标签视频数据集合的变化率;确定变化率大于设定阈值的分类对应的新视频标签,利用新视频标签更新标注的视频标签,利用该分类中的视频数据更新标签视频数据。本发明提供的动态更新视频标签的方法、装置及电子设备,解决了现有确定视频标签的方法对平台账户的代表性数据感知和更新不及时的问题。
-
公开(公告)号:CN111428806A
公开(公告)日:2020-07-17
申请号:CN202010258265.7
申请日:2020-04-03
Applicant: 北京达佳互联信息技术有限公司
IPC: G06K9/62
Abstract: 本公开关于一种图像标签确定方法、装置、电子设备及存储介质。该图像标签确定方法包括:将目标图像输入预设的至少一个图像标签预测模型,得到至少一个预测结果;对至少一个预测结果进行筛选,确定出至少一个目标预测结果;对至少一个目标预测结果中的预测概率进行校验,得到图像校验预测概率和对应的图像校验预测标签;将满足预设条件的图像校验预测概率对应的图像校验预测标签,确定为目标图像的标签。其中,对至少一个目标预测结果进行多重校验,根据多重校验结果来确定图像的标签,能够避免应用单一模型进行标签确定的不确定性,提高真实场景中对目标图像的标签进行识别的精度。
-
公开(公告)号:CN111046927A
公开(公告)日:2020-04-21
申请号:CN201911177127.X
申请日:2019-11-26
Applicant: 北京达佳互联信息技术有限公司
IPC: G06K9/62
Abstract: 本公开关于标注数据的处理方法、装置、电子设备及存储介质,包括:获取标注数据集和标注标签集;所述标注标签集包括候选标注标签,所述标注数据集包括由标注用户基于候选标注标签设置标注标签后的标注数据,所述候选标注标签具有对应的类别;获取所述标注数据的标注特征;采用在同一类别的所述候选标注标签计算标签特征,并采用所述标签特征计算所述同一类别的标签中心特征;计算在同一类别的所述标注特征和所述标签中心特征之间的距离;根据所述距离确定处于异常标注用户;删除在所述标注数据集中所述异常标注用户对应的标注数据。本实施例根据距离确定的异常标注用户,删除该标注用户的标注数据,使得用于训练模型的标注数据更加精确。
-
公开(公告)号:CN109522424A
公开(公告)日:2019-03-26
申请号:CN201811204512.4
申请日:2018-10-16
Applicant: 北京达佳互联信息技术有限公司
Abstract: 本申请提供了一种数据的处理方法、装置、电子设备及存储介质,包括:通过标签分类模型包括的已有标签对第一样本集中的样本进行标签标注,得到第二样本集,获取第二样本集中的未标注已有标签的目标样本;获取针对目标样本设置的描述信息;将描述信息与标签库包括的标签进行相似度计算,确定与描述信息的相似度最高的标签为新标签;通过新标签对第二样本集中的目标样本进行标注,得到包括目标样本以及目标样本对应的新标签的第三样本集。本申请通过将未标注已有标签的目标样本对应的描述信息与标签库包括的标签进行相似度计算,确定相似度最高的新标签对目标样本进行二次标注,完善了标签分类体系,提高了对多媒体样本的分类精度。
-
-
-
-
-
-