-
公开(公告)号:CN116484320A
公开(公告)日:2023-07-25
申请号:CN202310420433.1
申请日:2023-04-19
Applicant: 哈尔滨工业大学(威海)
Abstract: 本发明提供了一种大规模数据中非支配的频繁‑效用项集的高效挖掘方法,包括:根据前缀对数据集进行划分和网格存储;根据网格中存储的项的属性值,初始化多层索引链表结构,并按反对角线序读取网格;对于每个网格,将多层索引链表中存储的最大效用值作为条件约束,依次读取网格中满足约束的项所对应的前缀分片;在每个分片中,将满足条件约束的项加入到拓展集合中;依次拓展集合中的项,获得在支持度和效用值两个属性上具有支配能力的项集并将其加入到结果项集中。本发明提出了基于前缀划分策略、网格存储方式以及三组剪枝策略,能在大规模的海量数据上进行高效计算,有效剪枝掉大量无希望的项集,极大地节省了方法的空间开销和时间开销。