-
公开(公告)号:CN105868293A
公开(公告)日:2016-08-17
申请号:CN201610172070.4
申请日:2016-03-24
Applicant: 南京邮电大学
IPC: G06F17/30
CPC classification number: G06F16/951 , G06F2216/03
Abstract: 本发明公开了一种基于Topology模型的数据流频繁闭项集的挖掘方法,该方法通过单遍扫描输入数据流并基于基础窗口的概念进行划分,对若干基础窗口组成一个滑动窗口处理单元,数据流更新和删除以基础窗口为单位;对当前滑动窗口利用Topology分布式并行模型处理基础窗口,每个基础窗口利用CET树结构挖掘临界结果并合并插入GCFI?tree树中,挖掘出整个滑动窗口的全局频繁闭项集合并存储至Result?List表。转而进入下一次滑动窗口的迭代过程。实验证明,本文的方法能够保证挖掘结果准确性的同时,大大提高挖掘速度和存储空间,效果显著,具有较强的实用价值。