一种高维数据的组合式关联规则挖掘算法及系统

    公开(公告)号:CN114138866A

    公开(公告)日:2022-03-04

    申请号:CN202111457444.4

    申请日:2021-12-01

    Abstract: 本发明属于数据挖掘技术领域,具体涉及一种高维数据的组合式关联规则挖掘算法及系统。本发明根据计算的样本集的分布系数(Distribution)和删除阈值(TrimThreshold),增加数据筛选过程,在挖掘初期删除出现频次低于删除阈值的样本,简化高维样本集的空间复杂度;通过构建样本关系表,并以此为基础构建样本全关系组合,以全关系组合代替原始样本集进行挖掘;联合用户设置的最小支持度和最小置信度挖掘关联规则,从而计算出较强的关联关系。得到的关联关系精度高,且冗余度小,本发明可用于面向高维数据挖掘相关度强的关联关系挖掘,提高了海量数据挖掘的精度和效率。

Patent Agency Ranking