-
公开(公告)号:CN111241136A
公开(公告)日:2020-06-05
申请号:CN202010012489.X
申请日:2020-01-07
Applicant: 桂林电子科技大学
IPC: G06F16/2455 , G06F16/22 , G06F16/2458
Abstract: 本发明公开一种基于数据缓冲池的Top-k高效用项集挖掘方法,包括如下步骤:(1)数据挖掘运行参数初始化;(2)初次扫描事务数据库 并计算单一项的加权事务效用值,将最小阈值 初始化为0并创建初始化链表 ;(3)将单一项的加权事务效用值存入初始化链表 并按加权事务效用值升序排列;(4)再次扫描数据库 ,创建高效用项集队列;(5)调用搜索子程序Search,将初始化链表、评估效用共现结构EUCS、数据缓冲池DBP和索引链表 传入子程序Search;(6)输出效用最高的前 个高效用项集,完成数据挖掘。本发明方法通过数据缓冲池的方式,对已使用的数据空间进行回收,提高内存的复用率,降低高效用项集挖掘的运行时间和内存消耗。
-
公开(公告)号:CN110471960A
公开(公告)日:2019-11-19
申请号:CN201910774212.8
申请日:2019-08-21
Applicant: 桂林电子科技大学
IPC: G06F16/2458
Abstract: 本发明公开了一种含负效用的高效用项集挖掘方法,其特征是,包括如下步骤:1)数据挖掘运行参数初始化;2)扫描数据库D;3)覆盖链表;4)建立EUCS结构和PNU-List链表;5)调用搜索程序;6)计算Px.putils、Px.nutils和Px.rputils;7)确定含负效用的传递分支项集修剪策略;8)递归调用搜索程序;9)输出高效用项集。这种方法兼顾数据库中项目的单位效用为正和为负的情况,引入链表覆盖理论,在初次建立链表时进行压缩,构建效用链表提前过滤策略和含负效用的传递效用分支修剪策略,能减少低效用链表的构建,能缩小搜索空间,能降低高效用项集挖掘运行时间和内存消耗,提高高效用项集挖掘方法效率。
-
公开(公告)号:CN110471960B
公开(公告)日:2022-04-05
申请号:CN201910774212.8
申请日:2019-08-21
Applicant: 桂林电子科技大学
IPC: G06F16/2458
Abstract: 本发明公开了一种含负效用的高效用项集挖掘方法,其特征是,包括如下步骤:1)数据挖掘运行参数初始化;2)扫描数据库D;3)覆盖链表;4)建立EUCS结构和PNU‑List链表;5)调用搜索程序;6)计算Px.putils、Px.nutils和Px.rputils;7)确定含负效用的传递分支项集修剪策略;8)递归调用搜索程序;9)输出高效用项集。这种方法兼顾数据库中项目的单位效用为正和为负的情况,引入链表覆盖理论,在初次建立链表时进行压缩,构建效用链表提前过滤策略和含负效用的传递效用分支修剪策略,能减少低效用链表的构建,能缩小搜索空间,能降低高效用项集挖掘运行时间和内存消耗,提高高效用项集挖掘方法效率。
-
-