-
公开(公告)号:CN106802936A
公开(公告)日:2017-06-06
申请号:CN201611247714.8
申请日:2016-12-29
Applicant: 桂林电子科技大学
IPC: G06F17/30
CPC classification number: G06F16/2465 , G06F2216/03
Abstract: 本发明涉及一种基于项集熵的数据挖掘方法,包括以下步骤:对采集的数据进行预处理,转化为同纬度的事务数据集存放到数据库;检索数据库,获取单项集和多项集的支持度;根据项集熵计算单项集的权值,根据单项集的权值计算单项集的加权支持度;去除加权支持度不满足支持度阈值的单项集,得到加权频繁1项集;根据单项集权值计算多项集的权值,根据多项集的权值计算多项集的加权支持度;去除加权支持度不满足支持度阈值的多项集,得到加权频繁多项集;根据满足置信度阈值的加权频繁项集的加权支持度和置信度得到改进关联规则。本发明引入了项集熵的概念对关联规则进行改进,提升了关联规则进行数据挖掘时的精度。