-
公开(公告)号:CN109993231A
公开(公告)日:2019-07-09
申请号:CN201910270473.6
申请日:2019-04-04
Applicant: 浙江大学
IPC: G06K9/62
Abstract: 本发明公开了一种基于频繁项集的多标签分类方法,包括以下步骤:(1)在原始数据集上使用频繁项集挖掘算法挖掘出标签的频繁项集;(2)利用挖掘的频繁项集扩充原始数据集的标签空间,得到增强标签空间;(3)在增强标签空间中训练多标签分类器;(4)对于待测试样本,使用训练得到的多标签分类器预测其在增强标签空间中的增强标签;(5)对增强标签进行解码,得到待测试样本的最终标签。利用本发明,可以自动地挖掘出存在于多标签中的频繁项集,而这些频繁项集显式地包含了很强的高阶信息。因此,本方法可以有效地利用多标签数据中的高阶相关信息以进行多标签分类。
-
公开(公告)号:CN110188098A
公开(公告)日:2019-08-30
申请号:CN201910343325.2
申请日:2019-04-26
Applicant: 浙江大学
Abstract: 本发明公开了一种基于双层锚点图投影优化的高维向量数据可视化方法及系统,其中,具体方法包括:(1)对原始高维向量数据集D进行K-means聚类,将得到的聚类中心作为锚点集合A;(2)根据锚点集合A建立高维向量数据的倒排索引;(3)使用倒排索引建立数据集D的近似kD近邻图GD;(4)针对数据集D中的每个点d,暴力搜索距离d最近的c个锚点,并将这c个锚点作为d的邻居更新到近邻图GD;(5)在锚点集合A上用暴力检索方式构建kA近邻图GA;(6)基于GD和GA所表示成的高维空间数据结构信息,使用双层投影优化算法产生低维空间可视化投影。利用本发明,可以将高维空间中的全局宏观和局部微观结构信息一并保留,得到高质量的布局信息。
-
公开(公告)号:CN110188098B
公开(公告)日:2021-02-19
申请号:CN201910343325.2
申请日:2019-04-26
Applicant: 浙江大学
Abstract: 本发明公开了一种基于双层锚点图投影优化的高维向量数据可视化方法及系统,其中,具体方法包括:(1)对原始高维向量数据集D进行K‑means聚类,将得到的聚类中心作为锚点集合A;(2)根据锚点集合A建立高维向量数据的倒排索引;(3)使用倒排索引建立数据集D的近似kD近邻图GD;(4)针对数据集D中的每个点d,暴力搜索距离d最近的c个锚点,并将这c个锚点作为d的邻居更新到近邻图GD;(5)在锚点集合A上用暴力检索方式构建kA近邻图GA;(6)基于GD和GA所表示成的高维空间数据结构信息,使用双层投影优化算法产生低维空间可视化投影。利用本发明,可以将高维空间中的全局宏观和局部微观结构信息一并保留,得到高质量的布局信息。
-
-