基于并行PSO的最大容错频繁项集挖掘方法

    公开(公告)号:CN110309179A

    公开(公告)日:2019-10-08

    申请号:CN201910429541.9

    申请日:2019-05-22

    Inventor: 张红梅 齐东升

    Abstract: 本发明公开一种基于并行PSO的最大容错频繁项集挖掘方法,将目标事务数据库转换为对应的二进制矩阵,若转换后的二进制矩阵是稀疏矩阵,需要设定最小项支持度来删除不满足该阈值的项,根据矩阵维度初始化粒子群,在粒子群算法的速度更新公式中加入了高斯扰动项防止种群陷入局部最优,根据容错块的概念设计出粒子群算法的适应值函数,将种群中粒子转变成Spark平台中的RDD数据集,经过迭代后达到终止条件,得到最大容错块,当容错块的支持度大于最小支持度阈值时,则该容错块对应的项集为最大容错项集。本发明提高了算法的运行效率,保证了在相同目标事务数据库不同容错度的条件算法效率不变,同时对于稀疏型目标事务数据库也具有较高的性能。

    基于并行PSO的最大容错频繁项集挖掘方法

    公开(公告)号:CN110309179B

    公开(公告)日:2023-04-07

    申请号:CN201910429541.9

    申请日:2019-05-22

    Inventor: 张红梅 齐东升

    Abstract: 本发明公开一种基于并行PSO的最大容错频繁项集挖掘方法,将目标事务数据库转换为对应的二进制矩阵,若转换后的二进制矩阵是稀疏矩阵,需要设定最小项支持度来删除不满足该阈值的项,根据矩阵维度初始化粒子群,在粒子群算法的速度更新公式中加入了高斯扰动项防止种群陷入局部最优,根据容错块的概念设计出粒子群算法的适应值函数,将种群中粒子转变成Spark平台中的RDD数据集,经过迭代后达到终止条件,得到最大容错块,当容错块的支持度大于最小支持度阈值时,则该容错块对应的项集为最大容错项集。本发明提高了算法的运行效率,保证了在相同目标事务数据库不同容错度的条件算法效率不变,同时对于稀疏型目标事务数据库也具有较高的性能。

Patent Agency Ranking