-
公开(公告)号:CN108154174A
公开(公告)日:2018-06-12
申请号:CN201711399101.0
申请日:2017-12-22
Applicant: 北京工业大学
CPC classification number: G06K9/6282 , G06K9/6256 , G06N3/006 , G06N20/00
Abstract: 本发明公开一种基于核极限学习机及并行化的随机森林分类系统,包括:单机模块和并行化模块,其中,单机模块主要针对的是非海量数据集的处理,其包含四个子模块分别是数据抽取模块、模型训练模块、模型评估模块、模型优化模块。采用本发明的技术方案,不仅可以支持海量数据的处理,而且能够提高对数据的分类性能。
-
公开(公告)号:CN108108762A
公开(公告)日:2018-06-01
申请号:CN201711399080.2
申请日:2017-12-22
Applicant: 北京工业大学
Abstract: 本发明公开一种用于冠心病数据分类的基于核极限学习机及并行化的随机森林分类方法,采用Bootstrap方法对冠心病样本集进行有放回的采样,生成不同的冠心病数据训练子集和测试子集以供基分类器使用;采用混合核形式的核函数作为核极限学习机的核函数,减少核类型对分类模型的性能影响;使用冠心病数据训练子集对核极限学习机进行模型训练并使用测试子集对基分类器进行性能测试,采用排序加粒子群优化的方式循环判断重新生成优化的新基分类器,剔除并代替分类性能较差的基分类器,从而达到提高整体分类性能的目的;形成随机森林模型之后,采用相对多数投票法选取分类结果。
-
公开(公告)号:CN108108762B
公开(公告)日:2021-03-16
申请号:CN201711399080.2
申请日:2017-12-22
Applicant: 北京工业大学
Abstract: 本发明公开一种用于冠心病数据的核极限学习机及随机森林分类方法,采用Bootstrap方法对冠心病样本集进行有放回的采样,生成不同的冠心病数据训练子集和测试子集以供基分类器使用;采用混合核形式的核函数作为核极限学习机的核函数,减少核类型对分类模型的性能影响;使用冠心病数据训练子集对核极限学习机进行模型训练并使用测试子集对基分类器进行性能测试,采用排序加粒子群优化的方式循环判断重新生成优化的新基分类器,剔除并代替分类性能较差的基分类器,从而达到提高整体分类性能的目的;形成随机森林模型之后,采用相对多数投票法选取分类结果。
-
-