-
公开(公告)号:CN108416395A
公开(公告)日:2018-08-17
申请号:CN201810255706.0
申请日:2018-03-27
Applicant: 东北大学
IPC: G06K9/62
CPC classification number: G06K9/627 , G06K9/6282
Abstract: 本发明属于数据分析与挖掘技术领域,具体涉及一种基于属性简约的交互式决策树构建方法,包括以下步骤:1)根据属性简约方法得出有限样本集合的简约核集;2)根据所述简约核集生成决策树;3)进行交互式决策树剪枝。本发明针对大数据环境中数据维度较高导致用户难以理解的问题,利用互信息计算属性核集,对剩余属性利用粒子群算法进行训练;在训练的同时,引入条件属性与决策属性的依赖度对粒子速度进行更新,提高收敛速度,最终得到全局近似最优约简的属性集合;在决策树构建过程中融入领域专家的剪枝经验,能够提高决策树的分类精度,降低其错分代价。