-
公开(公告)号:CN110147852A
公开(公告)日:2019-08-20
申请号:CN201910458493.6
申请日:2019-05-29
Applicant: 北京达佳互联信息技术有限公司
Abstract: 本公开是关于一种图像识别的方法、装置、设备及存储介质,方法包括:获取目标训练数据集中的待标注训练数据的标注结果;当任一待标注训练数据的标注结果包含多种时,获取每一种标注结果的权重系数;基于每一种标注结果与对应的权重系数,获取待标注训练数据的标签,将标注了标签的训练数据作为训练机器学习模型的目标训练数据,利用基于目标训练数据训练得到的识别模型进行图像识别。提高了识别模型的识别结果的准确性以及识别结果的参考性和可信性。
-
公开(公告)号:CN108399409B
公开(公告)日:2019-06-18
申请号:CN201810055063.5
申请日:2018-01-19
Applicant: 北京达佳互联信息技术有限公司
CPC classification number: G06K9/342 , G06K9/6256 , G06K9/6267
Abstract: 本发明实施例提供了一种图像分类方法、装置及终端,其中所述方法包括:通过卷积神经网络确定图像对应的图像特征向量;其中,所述图像对应有文字描述信息;通过嵌入网络对所述文字描述信息进行处理,得到文字特征向量;将所述图像特征向量和文字特征向量拼接,得到图文特征向量;调用深度神经网络,根据所述深度神经网络依据所述图像特征向量、文字特征向量以及所述图文特征向量,确定所述图像对应的分类。通过本发明实施例提供的图像分类方法,能够提升图像分类的准确性。
-
公开(公告)号:CN108460343B
公开(公告)日:2019-06-07
申请号:CN201810118914.6
申请日:2018-02-06
Applicant: 北京达佳互联信息技术有限公司
Abstract: 本发明实施例公开了一种图像处理方法、系统及服务器,包括下述步骤:获取待处理的人脸图像;将所述人脸图像输入到预设的卷积神经网络模型中,并获取所述卷积神经网络模型响应所述人脸图像输入而输出的人脸关键点坐标,其中,所述卷积神经网络模型包括专注度机制,以使所述卷积神经网络抽取特征中包含关键点的局部信息;根据所述人脸关键点特征对所述人脸图像进行图像内容理解。卷积神经网络中设置专注度机制,使卷积神经网络模型在对人脸图像进行特征提取时,专注于人脸图像中用户关注的人脸关键点特征,进而使卷积神经网络模型提取的特征中仅包括或大部分为人脸关键点特征,从而提高关键点特征的占比,有效的提高了人脸图像关键点检测的准确率。
-
公开(公告)号:CN109816047A
公开(公告)日:2019-05-28
申请号:CN201910122128.8
申请日:2019-02-19
Applicant: 北京达佳互联信息技术有限公司
Abstract: 本申请公开了一种提供标签的方法、装置、设备及可读存储介质,属于深度学习技术领域。方法包括:基于深度学习模型预测目标内容的第一标签;根据第一标签获取与第一标签具有相关性的第二标签;将第一标签和第二标签作为目标内容的标签提供给标注系统进行标注。通过深度学习模型预测目标内容的第一标签,由于该第一标签比默认标签的标注精度要高,从而可以提高提供给标注系统的标签的准确率。此外,将第一标签和与第一标签具有相关性的第二标签作为目标内容的标签提供给标注系统,进一步提高了标注数据的可用比例,从而节省标注资源。
-
公开(公告)号:CN109598307A
公开(公告)日:2019-04-09
申请号:CN201811489992.3
申请日:2018-12-06
Applicant: 北京达佳互联信息技术有限公司
IPC: G06K9/62
Abstract: 本公开是关于一种数据筛选方法、装置、服务器及存储介质,属于互联网领域。该方法包括:采用至少一个分类模型对多个原始数据进行分类,得到每个原始数据的分类结果;基于每个原始数据的分类结果对该多个原始数据进行筛选,得到多个第一数据;根据该多个第一数据的类别标签,对该多个第一数据进行筛选,得到至少一个第二数据。本公开通过预设条件的预测概率筛选出第一数据,再根据类别标签筛选出第二数据,降低了人工标注带来的成本,避免了因人力资源有限所导致的对原始数据的利用率的限制,增大了海量的原始数据的利用率。
-
公开(公告)号:CN107818314B
公开(公告)日:2019-03-19
申请号:CN201711174894.6
申请日:2017-11-22
Applicant: 北京达佳互联信息技术有限公司
Abstract: 本发明实施例公开了一种脸部图像处理方法、装置及服务器,包括下述步骤:获取待处理的人脸图像;将所述人脸图像输入到预先训练的卷积神经网络模型中,获取所述卷积神经网络模型响应所述人脸图像输入而输出分类数据,所述卷积神经网络模型以损失函数为约束条件,限定所述分类数据中每一类的特征余弦值趋向于1;获取所述分类数据,并根据所述分类数据对所述人脸图像进行内容理解。使维特征向量与损失函数权值之间的余弦值趋向于1,以此,达到类内距离收敛的效果,类内距离的收敛进而使分类数据的类间距离增大,类内距离的增大能够使分类数据区别更加的明显,数据的鲁邦性增加,同样也会提高内容理解的准确性。
-
公开(公告)号:CN109409414A
公开(公告)日:2019-03-01
申请号:CN201811142162.3
申请日:2018-09-28
Applicant: 北京达佳互联信息技术有限公司
IPC: G06K9/62
Abstract: 本公开是关于一种样本图像确定方法和装置、电子设备及存储介质,其中所述方法包括:采用第一预设数量的分类器分别对各样本图像进行预测,得到所述各样本图像对应的预测向量;分别将所述各样本图像对应的预测向量转化成概率向量;依据所述各样本图像对应的概率向量,从所述各样本图像中确定困难样本图像。本公开提供的样本图像确定能够准确、快速的从多个样本图像中提取从困难样本图像,并且无需人工手动干预,能够节省人力资源。
-
公开(公告)号:CN109389220A
公开(公告)日:2019-02-26
申请号:CN201811143319.4
申请日:2018-09-28
Applicant: 北京达佳互联信息技术有限公司
IPC: G06N3/08
CPC classification number: G06N3/08
Abstract: 本申请是关于一种神经网络模型的处理方法、装置、电子设备以及存储介质。在本申请实施例中,每一个样本数据的标注标签为一个,也即,样本数据为单标签数据集,通过本申请实施例的方法,使用单标签数据集可以训练出目标多标签分类模型,之后当需要预测本身含有多个标签的数据的标签时,通过目标多标签分类模型就可以得到该数据的多个标签。相比于相关技术,本申请无需工作人员需要依次人工标注样本数据是否属于标签体系中的每一个分类标签,降低了人工成本且提高了效率。
-
公开(公告)号:CN109376696A
公开(公告)日:2019-02-22
申请号:CN201811437221.X
申请日:2018-11-28
Applicant: 北京达佳互联信息技术有限公司
IPC: G06K9/00
Abstract: 本公开是关于一种视频动作分类的方法、装置、计算机设备和存储介质,属于机器学习模型技术领域。所述方法包括:获取待分类视频,确定待分类视频中的多个视频帧;将多个视频帧输入到训练后的优化视频动作分类模型中的光流替代模块中,得到多个视频帧对应的光流特征信息;将多个视频帧输入到训练后的优化视频动作分类模型中的三维卷积神经模块中,得到多个视频帧对应的空间特征信息;基于光流特征信息和空间特征信息,确定待分类视频对应的分类类别信息。采用本公开,可以将待分类视频的多个视频帧直接作为模型中的光流替代模块的输入,光流替代模块可以直接提取待分类视频的多个视频帧对应的光流特征信息,进一步提高了分类处理的效率。
-
公开(公告)号:CN109359592A
公开(公告)日:2019-02-19
申请号:CN201811204526.6
申请日:2018-10-16
Applicant: 北京达佳互联信息技术有限公司
Abstract: 本申请提供了一种视频帧的处理方法、装置、电子设备及存储介质,包括:获取视频样本的多个关键帧图像;分别提取每个关键帧图像的图像特征,得到多个第一图像特征;将多个第一图像特征导入注意力机制模型,输出基于图像通道的注意力的多个第二图像特征;将多个第二图像特征进行特征融合,得到融合特征。本申请基于注意力机制,捕捉视频样本中多个关键帧图像之间基于图像通道的关联性,并通过特征融合操作得到融合特征,使得融合特征包括了关键帧之间的关联性,提高了特征的精度,另外,特征融合操作没有对关键帧帧数的限定,因此可以实现对不同时长视频的处理,降低了对不定时长的视频进行特征提取的操作繁琐程度。
-
-
-
-
-
-
-
-
-