-
公开(公告)号:CN103150311B
公开(公告)日:2018-03-09
申请号:CN201110418088.5
申请日:2011-12-07
Applicant: 微软技术许可有限责任公司
IPC: G06F17/30
Abstract: 本发明提供了一种基于数据划分的频繁对象挖掘方法。首先,用一相对较小的局部阈值对经随机划分的数据库进行局部频繁对象挖掘,然后再从局部挖掘对象的并集中挖掘全局频繁对象。这种方法解决了现有的频繁对象挖掘方法的规模受限于存储器容量的问题。当应用于挖掘频繁闭序列时,可作用于例如超过4亿个序列的超大规模的序列数据库,且具有例如99%的高召回率。这一规模约比现有方法所支持的数据库规模高了两个数量级。