图像分类方法、装置、计算机设备及计算机可读存储介质

    公开(公告)号:CN110135505A

    公开(公告)日:2019-08-16

    申请号:CN201910418617.8

    申请日:2019-05-20

    Inventor: 张志伟 刘岸 李铅

    Abstract: 本公开关于一种图像分类方法、装置、计算机设备及计算机可读存储介质。通过将待分类图像属于各个类别的概率值与概率阈值进行比较,当该概率值小于概率阈值时,将待分类图像的图像特征与多个类别特征进行匹配,确定与该图像特征匹配成功的类别特征,由于类别特征可以用于表示一个类别的图像应具有的特征,因此,可以将所确定的类别特征对应的类别作为该图像所属的类别,在保证分类结果准确率的同时,提高了图像分类任务中的召回率,使得图像分类任务中被正确分类的图像数量大幅增多。

    获取训练数据的方法、装置、设备及存储介质

    公开(公告)号:CN110070143A

    公开(公告)日:2019-07-30

    申请号:CN201910356202.2

    申请日:2019-04-29

    Abstract: 本公开是关于一种获取训练数据的方法、装置、设备及存储介质,方法包括:获取目标训练数据子集,目标训练数据子集为初始训练数据集的多个训练数据子集中的任意一个;在初始训练数据集的训练数据子集中,获取除目标训练数据子集之外的第一参考数量个训练数据子集;在第一参考数量个训练数据子集中,获取每一个训练数据子集中第二参考数量个训练数据,得到第一参考数量组的训练数据;将第一参考数量组的训练数据添加到目标训练数据子集中,基于更新后的目标训练数据子集及初始训练数据集中剩余的训练数据子集获取用于对机器学习模型进行训练的目标训练数据。本申请可提高模型的识别准确率,减少获取训练数据的时间成本。

    样本获取方法、装置、电子设备及可读存储介质

    公开(公告)号:CN109961094A

    公开(公告)日:2019-07-02

    申请号:CN201910171163.9

    申请日:2019-03-07

    Inventor: 张志伟

    Abstract: 本申请实施例提供了一种样本获取方法、装置、电子设备及可读存储介质,应用于互联网技术领域,所述方法包括:根据预先建立的标签树,确定预设标签在标签树中的层级,标签树是对训练集中每个数据携带的标签进行分类得到的;按照标签树从上到下的顺序,对样本集进行逐层筛选,使每一层的筛选结果作为下一层筛选的数据源,直至筛选的层级为预设标签在标签树中的层级;在每一层筛选时,计算该层对应的训练数据的平均特征,根据平均特征在该层数据源中选取预设比例的数据,将预设比例的数据作为筛选结果;获取预设标签在标签树中的层级对应的筛选结果。本申请实施例可提高样本获取的准确性。

    分类模型的训练方法、装置、电子设备及存储介质

    公开(公告)号:CN109858558A

    公开(公告)日:2019-06-07

    申请号:CN201910113211.9

    申请日:2019-02-13

    Abstract: 本公开是关于一种分类模型的训练方法、装置、电子设备及存储介质。该训练方法中,预先将各个样本数据的分类标签,按照语义划分为具有上下位关系的至少两个层级;确定待训练的分类模型所需训练阶段的目标数量;在每一训练阶段,确定该训练阶段对应的目标层级,利用样本数据集中,目标层级的分类标签对应的样本数据,对分类模型进行训练,在满足预定收敛条件时,结束该训练阶段的训练过程;其中,目标数量个训练阶段中,至少有两个训练阶段所对应的目标层级不相同;在最后一个训练阶段结束后,完成对分类模型的训练。本公开提供的分类模型的训练方法,可以在将样本数据的分类标签之间的上下位关系考虑在内的前提下,实现对分类模型的有效训练。

    多媒体文件的预测方法和装置

    公开(公告)号:CN108304459B

    公开(公告)日:2019-03-12

    申请号:CN201711409084.4

    申请日:2017-12-22

    Inventor: 张志伟 杨帆

    Abstract: 本发明提供了一种多媒体文件的预测方法和装置,其中,所述方法包括:对目标多媒体文件集分别通过语音识别算法、图像识别算法及自然语言处理算法,识别得到三个标签集;根据三个标签集,将目标多媒体文件集中的各目标多媒体文件划分至预设主题集的各主题中,并统计各目标多媒体文件在各主题中的分布概率;根据各目标多媒体文件在各主题中的分布概率及各主题中目标主题对应的条件分布概率,预测各目标多媒体文件的得分;按照得分对各目标多媒体文件进行排序。从而可以解决单独采用语音识别算法、图像识别算法或自然语言处理算法进行内容识别,准确性较差的问题,取得了提高多媒体文件内容识别的准确性的有益效果。

    样本图像筛选方法和装置、电子设备及存储介质

    公开(公告)号:CN109389162A

    公开(公告)日:2019-02-26

    申请号:CN201811142163.8

    申请日:2018-09-28

    Abstract: 本公开是关于一种样本图像筛选方法和装置、电子设备及存储介质,其中所述方法包括:采用图像分类器分别对待筛选的各样本图像进行预测,得到所述各样本图像对应的特征向量和分类标签;对所述各样本图像对应的特征向量进行聚类,分别确定所述各样本图像所属的聚类中心;依据各所述样本图像对应的聚类中心和分类标签,对各聚类中心进行合并;依据合并结果筛选出目标样本图像。通过本公开的样本图像筛选方法,能够及时、准确地对“新”数据进行筛选无需人工手动干预,能够节省人力资源,通过筛选出的“新”数据可以进一步生成“新”标签。

    图像标签识别方法、装置及服务器

    公开(公告)号:CN109117862A

    公开(公告)日:2019-01-01

    申请号:CN201810712097.7

    申请日:2018-06-29

    CPC classification number: G06K9/6267 G06K9/6256

    Abstract: 本公开是关于一种图像标签识别方法、装置及服务器,其中所述方法包括:基于预先标记的样本图像和预先训练好的图像分类模型,构建标签视觉路由图;从所述预先标记的样本图像中选择一批样本图像;通过所述标签视觉路由图,确定所述批样本图像中各样本图像的最相近样本图像和最困难样本图像;依据各所述图像对构建目标损失函数,并依据所述目标损失函数训练目标图像分类模型;通过所述目标图像分类模型,对待识别图像进行标签识别。通过上述图像标签识别方法,能够将标签分类更加细化,提示目标分类模型的标签识别准确度。

    图像处理方法、装置及终端

    公开(公告)号:CN108108738B

    公开(公告)日:2018-11-16

    申请号:CN201711219332.9

    申请日:2017-11-28

    Inventor: 张志伟 杨帆

    Abstract: 本发明实施例提供了一种图像处理方法、装置及终端,其中所述方法包括:通过卷积神经网络对图像进行卷积处理的过程中,判断当前预调用的第一卷积层是否设置有第一片选模块;若所述第一卷积层设置有第一片选模块,将前一卷积层的输出数据分别输入至所述第一片选模块以及所述第一卷积层中;调用所述第一片选模块,由所述第一片选模块依据所述前一卷积层的输出数据,从所述第一卷积层包含的特征图中确定目标特征图;调用所述第一卷积层,由所述第一卷积层依据所述目标特征图对所述前一卷积层的输出数据进行卷积处理,得到输出数据。通过本发明实施例提供的图像处理方法,能够减小计算量,从而提高任务处理效率。

    一种分类模型的损失值获取方法及装置

    公开(公告)号:CN108629377A

    公开(公告)日:2018-10-09

    申请号:CN201810443376.8

    申请日:2018-05-10

    Inventor: 张志伟

    CPC classification number: G06K9/627 G06K9/6262

    Abstract: 本发明实施例提供了一种分类模型的损失值获取方法及装置。通过本发明实施例的方法,在获取预设分类模型的损失值时,不仅使用了样本数据在多个预设分类中所属于的第一预设分类,还使用了样本数据在多个预设分类中不属于的第二预设分类,进而根据第一预设分类使用梯度下降算法获取预设分类模型的第一子损失值,然后根据第二预设分类使用梯度上升算法获取预设分类模型的第二子损失值,再根据第一子损失值和第二子损失值获取预设分类模型的损失值。相比于仅仅根据样本数据所属于的一小部分预设分类获取预设分类模型的损失值,本发明实施例可以提高获取到的预设分类模型的损失值的准确度,进而提高优化得到预设分类模型对数据的分类的精确度。

    图像分类模型优化方法、装置及终端

    公开(公告)号:CN108614858A

    公开(公告)日:2018-10-02

    申请号:CN201810246754.3

    申请日:2018-03-23

    Inventor: 张志伟 杨帆

    Abstract: 本发明实施例提供了一种图像分类模型优化方法、装置及终端,其中,所述方法包括:通过模型初始训练数据对当前第一图像分类模型进行修正,得到修正后的第二图像分类模型;通过所述第二图像分类模型,对所述噪声数据库中存储的噪声数据进行筛选得到第一中间数据库;以及通过第二图像分类模型对预设时间段内用户生成的噪声数据进行筛选,得到第二中间数据库;按照预设规则,对第一中间数据库与第二中间数据库进行合并得到第三中间数据库;采用第三中间数据库中的噪声数据,全部替换所述噪声数据库中的噪声数据,以优化所述第一图像分类模型。本发明提供的图像分类模型优化方法,能够保证图像分类模型优化的时效性,避免图像分类模型的预测能力退化。

Patent Agency Ranking