-
公开(公告)号:CN108334951A
公开(公告)日:2018-07-27
申请号:CN201710050188.4
申请日:2017-01-20
Applicant: 微软技术许可有限责任公司
IPC: G06N99/00
CPC classification number: G06N5/003 , G06N99/005
Abstract: 本公开的实施例涉及基于针对节点的数据的预统计的决策树生成。获取针对决策树的节点的多个数据样本,这些数据样本关于第一特征具有相应的特征值。在从预定义的多个数值范围中确定目标范围,使得落入目标范围中的特征值的数目超过了预定阈值数目。继而,将除落入目标范围中的特征值之外的其余特征值分配到相应的数值范围,并且对基于其余特征值的分配对落入所有数值范围中的特征值计数,以用于多个数据样本向节点的子节点的分配。此种方式,显著提高了数据处理速度和效率,进而提高了决策树的生成速度和效率。
-
公开(公告)号:CN108334951B
公开(公告)日:2023-04-25
申请号:CN201710050188.4
申请日:2017-01-20
Applicant: 微软技术许可有限责任公司
Abstract: 本公开的实施例涉及基于针对节点的数据的预统计的决策树生成。获取针对决策树的节点的多个数据样本,这些数据样本关于第一特征具有相应的特征值。在从预定义的多个数值范围中确定目标范围,使得落入目标范围中的特征值的数目超过了预定阈值数目。继而,将除落入目标范围中的特征值之外的其余特征值分配到相应的数值范围,并且对基于其余特征值的分配对落入所有数值范围中的特征值计数,以用于多个数据样本向节点的子节点的分配。此种方式,显著提高了数据处理速度和效率,进而提高了决策树的生成速度和效率。
-