-
公开(公告)号:CN111259933B
公开(公告)日:2023-06-13
申请号:CN202010022431.3
申请日:2020-01-09
Applicant: 中国科学院计算技术研究所
IPC: G06F18/2431 , G06N5/01 , G06F16/27 , G06F16/28 , G06F16/2458
Abstract: 本发明提出一种基于分布式并行决策树的高维特征数据分类方法及系统。实现了基于Spark的面向高维特征数据的并行决策树算法,该并行算法并行程度高,可以处理大规模数据集,不仅在决策树中同一层节点之间进行并行计算,而且能够在特征层面上进行并行计算,提高了高维数据的并行程度,能够有效减少高维特征的处理时间。
-
公开(公告)号:CN111259933A
公开(公告)日:2020-06-09
申请号:CN202010022431.3
申请日:2020-01-09
Applicant: 中国科学院计算技术研究所
IPC: G06K9/62 , G06F16/27 , G06F16/28 , G06F16/2458
Abstract: 本发明提出一种基于分布式并行决策树的高维特征数据分类方法及系统。实现了基于Spark的面向高维特征数据的并行决策树算法,该并行算法并行程度高,可以处理大规模数据集,不仅在决策树中同一层节点之间进行并行计算,而且能够在特征层面上进行并行计算,提高了高维数据的并行程度,能够有效减少高维特征的处理时间。
-