-
公开(公告)号:CN111898630A
公开(公告)日:2020-11-06
申请号:CN202010508804.8
申请日:2020-06-06
Applicant: 东南大学
IPC: G06K9/62
Abstract: 本发明涉及一种面向含噪声标记样本的特征选择方法,该方法对具有歧义标记信息的样本进行特征筛选,以达到数据预处理的目的。该方法包括以下步骤:(1)采用标记置信度的方式表示标记信息,并基于数据原始的含噪标记信息初始化标记置信度;(2)随机选择部分特征,在所选特征上对样本进行聚类学习;(3)根据得到的聚类结果,计算每个聚类中每个标记的标记置信度;(4)选择具有最大标记置信度的标记作为聚类的标记,同时将置信值作为该类标记的权重,得到聚类-标记-权重三元关系,同时更新标记置信度;(5)根据得到的聚类-标记-标记权重三元组,计算特征权重;(6)若标记置信度保持不变,则转到步骤(7),否则转到步骤(2);(7)根据特征权重进行特征筛选;(8)结束。
-
公开(公告)号:CN110414575A
公开(公告)日:2019-11-05
申请号:CN201910622900.2
申请日:2019-07-11
Applicant: 东南大学
IPC: G06K9/62
Abstract: 本发明公开了一种融合局部度量的半监督多标记距离度量学习方法,对任一多标记应用场景提取训练数据,并对少量数据进行标注;对于已标注数据,过滤掉标记占有率小于设定阈值的样本,对于未标注数据,通过聚类等操作去除异常点,提高样本质量;将待学习的距离度量表示为组合距离度量形式;基于距离度量表示构造优化项;构建多标记损失项和流形正则化项联合优化模型,学得距离度量;将原数据映射到距离度量空间,然后使用已有半监督多标记学习算法进行学习,从而得到融合局部度量的半监督多标记分类器;将待预测样本输入上述分类器,得到标注样本。采用本发明可以降低人力标注成本,促进了多标记学习框架的实际应用。
-
公开(公告)号:CN105069133A
公开(公告)日:2015-11-18
申请号:CN201510506268.7
申请日:2015-08-18
Applicant: 东南大学
IPC: G06F17/30
CPC classification number: G06F17/30247
Abstract: 本发明提供了一种基于未标记数据的数字图像分类方法。该方法包括以下步骤:(1)用户从包含已分类图像与未分类图像的多标记图像库中选择查询图像,包括相关图像和不相关图像;(2)在选取的已分类数字图像上使用已有的分类方法学习得到一个初始分类模型;(3)在所有查询图像上使用本发明提出的分类方法对初始分类模型进行学习优化得到一个最终分类模型;(4)基于最终分类模型对数字图像存储设备中待分类图像进行分类,并返回分类结果;(5)如果用户对分类结果满意,则执行步骤6,否则从多标记图像库中选择更多的查询图像进行反馈,执行步骤2;(6)结束。该方法能够有效利用大量未分类图像对数字图像的所有可能类别进行分类。
-
公开(公告)号:CN119888884A
公开(公告)日:2025-04-25
申请号:CN202411836864.7
申请日:2024-12-13
Applicant: 中国电子科技集团公司第五十四研究所 , 东南大学
IPC: G07C3/00
Abstract: 本发明涉及无人机测控及通信链路数据挖掘技术领域,特别涉及无人机地面站研发中基于有限状态机的无人机时序数据回放器的通用设计方法。包括有限状态机模型和结构化逻辑框架两部分设计要素,适用于无人机地面站、计算机技术应用领域。本设计方法中的有限状态机模型明确定义并解耦了回放器的各行为和状态;结构化逻辑框架描述了回放器的通用接口和核心逻辑,其中自定义数据解码模块可以松耦合的方式对不同格式的回放数据文件多态实现。本设计方法保障了回放器程序的安全性、可维护性和可扩展性。
-
公开(公告)号:CN118981690A
公开(公告)日:2024-11-19
申请号:CN202411005624.2
申请日:2024-07-25
Applicant: 东南大学
IPC: G06F18/2413 , G06F18/241 , G06F18/22 , G06N3/0499 , G06N3/084
Abstract: 本发明公开了一种面向多维度语义对象的深度度量学习方法,至少包括两个学习阶段;第一学习阶段中:同时计算两组隐特征向量,其中一组用于学习每个维度内独特的相似度度量,另一组用于学习跨维度的共有相似度度量;第二学习阶段中:使用注意力模块结合第一学习阶段学到的两组隐特征向量,进一步学习每个维度特有的相似度度量,通过共有度量考虑维度相关性信息,输出每个维度专属的隐特征表示,最后采用5近邻分类准则为多维度语义对象进行分类。本发明方法进一步提高多维度语义对象分类模型的分类性能与泛化能力。
-
公开(公告)号:CN113379037B
公开(公告)日:2023-11-10
申请号:CN202110717550.5
申请日:2021-06-28
Applicant: 东南大学
IPC: G06N3/091 , G06N3/0985 , G06N3/045
Abstract: 本发明公开了一种基于补标记协同训练的偏多标记学习方法,该方法针对样本多标记场景下训练数据中存在噪声标记的问题,提高分类模型的性能。该方法使用了两个神经网络进行协同训练,其中一个网络仅从候选标记集合中学习,另一个网络仅从非候选标记集合即补标记中学习。具体来说,在每个batch数据中选择损失小的样本,指导另一个网络更新参数,最后按权重组合两个网络的输出来赋予此batch数据标记置信度。分别从候选标记和非候选标记中学习并综合考虑两个网络来降低候选标记中噪声对模型性能的影响,从而获得偏多标记学习场景下的鲁棒分类模型。
-
公开(公告)号:CN116881713A
公开(公告)日:2023-10-13
申请号:CN202310816049.3
申请日:2023-07-05
Applicant: 东南大学
IPC: G06F18/214 , G06F18/24 , G06F18/21 , G06N3/048 , G06N3/08
Abstract: 本发明公开一种基于主动查询和分组标注的多义数据标注方法,具体包括以下步骤:(1)用户初始时选择小部分多义数据进行精确标注;(2)利用深度神经网络在小部分已标注数据上训练多标记分类网络;(3)利用多标记分类网络对未标注数据的标记向量进行预测;(4)对该被查询示例的标记空间分组,小部分组发送给领域专家进行精确标注;(5)将该样本加入已标注集,更新多标记分类网络参数,在测试集上测试效果;(6)如果用户对当前模型性能满意,则结束,否则转步骤(3)。本发明能够在多义数据标注的质量和成本之间达到一定平衡,在减少标注成本的同时提高标注质量。
-
公开(公告)号:CN111783788B
公开(公告)日:2022-11-08
申请号:CN202010583875.4
申请日:2020-06-24
Applicant: 东南大学
IPC: G06V10/764 , G06V10/774 , G06V10/30
Abstract: 本发明公开了一种面向标记噪声的多标记分类方法,该方法适用于标记空间含有噪声的多标记数据分类场景,具体包括以下步骤:(1)用户在保证完全获得真实标记的前提下收集多标记数据;(2)利用ECOC编码对原始标记进行embedding,按照ECOC编码重新为每个码字选择正负训练样本;(3)基于每个码字重构的二类分类集训练二类分类模型;(4)根据训练所得分类模型对未见示例进行预测,得到每个码字上的分类结果;(5)根据欧式距离计算原始空间每个标记的ECOC编码和未见示例的预测编码之间的距离,将满足筛选条件的标记视为未见示例的真实标记;(6)如果用户对预测结果满意,则结束,否则转到步骤(2),对原始标记重新进行ECOC编码。
-
公开(公告)号:CN114861816A
公开(公告)日:2022-08-05
申请号:CN202210574747.2
申请日:2022-05-25
Applicant: 东南大学
Abstract: 本发明提出了一种基于类属特征构造的含噪多标记分类方法,该方法适用于标记空间含有噪声的多标记数据分类场景。该方法包括以下步骤:(1)用户在保证完全获得真实标记的前提下收集多标记数据;(2)利用特征空间的内部结构信息对含噪标记进行消歧;(3)基于已消歧的数据集,为每个标记构建类属特征映射;(4)根据每个标记的类属特征映射构建二分类数据集,并训练二分类模型;(5)根据训练得到的分类模型对未见示例进行预测,得到每个类别的分类结果;(6)如果用户对预测结果满意,则结束,否则转到步骤(2),对原始标记重新进行消歧。
-
公开(公告)号:CN111783788A
公开(公告)日:2020-10-16
申请号:CN202010583875.4
申请日:2020-06-24
Applicant: 东南大学
Abstract: 本发明公开了一种面向标记噪声的多标记分类方法,该方法适用于标记空间含有噪声的多标记数据分类场景,具体包括以下步骤:(1)用户在保证完全获得真实标记的前提下收集多标记数据;(2)利用ECOC编码对原始标记进行embedding,按照ECOC编码重新为每个码字选择正负训练样本;(3)基于每个码字重构的二类分类集训练二类分类模型;(4)根据训练所得分类模型对未见示例进行预测,得到每个码字上的分类结果;(5)根据欧式距离计算原始空间每个标记的ECOC编码和未见示例的预测编码之间的距离,将满足筛选条件的标记视为未见示例的真实标记;(6)如果用户对预测结果满意,则结束,否则转到步骤(2),对原始标记重新进行ECOC编码。
-
-
-
-
-
-
-
-
-