一种基于改进Apriori算法的数据库关联规则挖掘方法

    公开(公告)号:CN105320756A

    公开(公告)日:2016-02-10

    申请号:CN201510666724.4

    申请日:2015-10-15

    CPC classification number: G06F17/30595

    Abstract: 本发明提出了一种基于改进Apriori算法的数据库关联规则挖掘方法。本方法将事务数据库转化为关系矩阵,转化后的关系矩阵为稀疏矩阵,并使用正交链表存储关系矩阵。频繁项目集的产生过程转化为对应关系矩阵中项目所对应单链表节点集合的运算过程。本方法只需扫描数据库一遍,克服了Apriori及其相关算法产生大量候选集和需多次扫描数据库的缺点,减少了频繁进行I/O操作的时间;其次,生成和发现频繁2-项集时只需要进行节点集合的交运算,耗费时间较少,并且对生成的频繁k-项集构造单链表进行记录,简化了频繁k+1项集的生成过程,避免了Apriori算法复杂的剪枝过程。

    基于预判筛选的局部扫描关联规则计算机数据分析方法

    公开(公告)号:CN106407296A

    公开(公告)日:2017-02-15

    申请号:CN201610764220.0

    申请日:2016-08-30

    CPC classification number: G06F16/2465 G06F2216/03

    Abstract: 本发明公开了基于预判筛选的局部扫描关联规则计算机数据分析方法,本发明针对经典Apriori算法的固有缺陷,基于预判筛选的关联规则分析算法,提出一种基于事务号查询的局部扫描关联规则分析算法-MAWP算法,该算法对包含频繁k项集的事务号进行记录,然后在连接、剪枝、预判筛选的基础上,在对筛选后的候选k项集进行验证的过程中,不是对数据库中所有事务进行全部扫描,而是进行局部扫描,仅扫描包含某k-1项集并且事务数最少的事务集合,从而减少确定频繁项目集所扫描的事务总数,降低算法运算的时间,提高算法的运算效率。

Patent Agency Ranking