-
公开(公告)号:CN114219017A
公开(公告)日:2022-03-22
申请号:CN202111459333.7
申请日:2021-12-02
Applicant: 中国科学院信息工程研究所
Abstract: 本发明公开了一种隐式语义数据增强方法。本发明第一阶段利用原始数据训练特征提取器和分类器,然后利用分类器构建知识图谱,并基于提取的特征计算每个类别的类中心和协方差矩阵;第二阶段利用构建的知识图谱识别出尾部类别的相似类别,然后将相似类别的特征变换方向迁移到每个尾部样本上进行特征变化。通过挖掘类别之间的相关关系,极大地丰富了尾部类别多样性。最后,对每个样本沿着迁移的协方差矩阵进行变化方向的无限次高斯分布采样可以获得无穷样本,通过优化无限样本损失函数的上界,得到一个新的基于推理的隐式语义数据增强损失进行模型训练。
-
公开(公告)号:CN114219017B
公开(公告)日:2025-04-22
申请号:CN202111459333.7
申请日:2021-12-02
Applicant: 中国科学院信息工程研究所
IPC: G06F18/214 , G06F16/36 , G06F18/24 , G06N5/022 , G06N3/096
Abstract: 本发明公开了一种隐式语义数据增强方法。本发明第一阶段利用原始数据训练特征提取器和分类器,然后利用分类器构建知识图谱,并基于提取的特征计算每个类别的类中心和协方差矩阵;第二阶段利用构建的知识图谱识别出尾部类别的相似类别,然后将相似类别的特征变换方向迁移到每个尾部样本上进行特征变化。通过挖掘类别之间的相关关系,极大地丰富了尾部类别多样性。最后,对每个样本沿着迁移的协方差矩阵进行变化方向的无限次高斯分布采样可以获得无穷样本,通过优化无限样本损失函数的上界,得到一个新的基于推理的隐式语义数据增强损失进行模型训练。
-
公开(公告)号:CN114926676A
公开(公告)日:2022-08-19
申请号:CN202210425626.1
申请日:2022-04-21
Applicant: 中国科学院信息工程研究所
IPC: G06V10/764 , G06K9/62 , G06V10/774 , G06F17/16 , G06V10/40 , G06V10/74
Abstract: 本发明公开了一种基于特征空间有效面积的自适应加权长尾分类方法及装置,所述方法包括:在原始数据的分布上训练特征提取器与分类器,得到基本分类模型;基于训练后的特征提取器,抽取所述原始数据的特征表示,并根据每一类别中所述特征表示之间的相关系数,构建该类别的相关系数矩阵;基于所述相关系数矩阵,计算每一类别在特征空间中的有效面积,并通过所述有效面积给各类别分配权重,训练所述基本分类模型,以得到分类模型;基于所述分类模型,获取待检测数据的分类结果。本发明通过估计特征空间中的有效面积从而给予不同的类别不同的权重损失,更好的划分特征空间,以对长尾数据进行更有效地分类。
-
公开(公告)号:CN114926676B
公开(公告)日:2025-05-02
申请号:CN202210425626.1
申请日:2022-04-21
Applicant: 中国科学院信息工程研究所
IPC: G06V10/764 , G06V10/774 , G06F17/16 , G06V10/40 , G06V10/74
Abstract: 本发明公开了一种基于特征空间有效面积的自适应加权长尾分类方法及装置,所述方法包括:在原始数据的分布上训练特征提取器与分类器,得到基本分类模型;基于训练后的特征提取器,抽取所述原始数据的特征表示,并根据每一类别中所述特征表示之间的相关系数,构建该类别的相关系数矩阵;基于所述相关系数矩阵,计算每一类别在特征空间中的有效面积,并通过所述有效面积给各类别分配权重,训练所述基本分类模型,以得到分类模型;基于所述分类模型,获取待检测数据的分类结果。本发明通过估计特征空间中的有效面积从而给予不同的类别不同的权重损失,更好的划分特征空间,以对长尾数据进行更有效地分类。
-
-
-