频繁序列挖掘方法
    1.
    发明公开

    公开(公告)号:CN104537025A

    公开(公告)日:2015-04-22

    申请号:CN201410802280.8

    申请日:2014-12-19

    CPC classification number: G06F17/30548

    Abstract: 本发明涉及数据隐私和数据挖掘技术领域,公开了一种频繁序列挖掘方法,包括步骤:S1:从原始数据库中计算序列最大限制长度lmax,并获取β={β1,...βi...,βn},βi表示长度为i的序列的最大支持度;S2:根据所述lmax和β={β1,...βi...,βn},基于抽样的候选集剪枝技术,在满足差分隐私保护范式的条件下从所述原始数据库中查找频繁序列。本发明中的满足差分隐私的基于抽样实现候选集剪枝的频繁序列挖掘方法(PFS2)能够在满足差分隐私保护的同时提供较高的挖掘结果可用性。

    频繁项集挖掘方法
    2.
    发明公开

    公开(公告)号:CN105740245A

    公开(公告)日:2016-07-06

    申请号:CN201410746488.2

    申请日:2014-12-08

    Abstract: 本发明涉及数据挖掘及数据隐私技术领域,公开了一种频繁项集挖掘方法,包括:S1:将原始数据库中事务长度大于限制长度的事务分割成多个子事务,使得分割后数据库中每条事务的长度不大于所述限制长度;S2:根据预先指定的支持度阈值,在分割后的数据库中利用支持度估计法和动态下降法挖掘频繁项集。本发明能够在满足差分隐私保护的同时提供更高的挖掘效率和挖掘结果可用性。

    频繁序列挖掘方法
    3.
    发明授权

    公开(公告)号:CN104537025B

    公开(公告)日:2017-10-10

    申请号:CN201410802280.8

    申请日:2014-12-19

    Abstract: 本发明涉及数据隐私和数据挖掘技术领域,公开了一种频繁序列挖掘方法,包括步骤:S1:从原始数据库中计算序列最大限制长度lmax,并获取β={β1,...βi...,βn},βi表示长度为i的序列的最大支持度;S2:根据所述lmax和β={β1,...βi...,βn},基于抽样的候选集剪枝技术,在满足差分隐私保护范式的条件下从所述原始数据库中查找频繁序列。本发明中的满足差分隐私的基于抽样实现候选集剪枝的频繁序列挖掘方法(PFS2)能够在满足差分隐私保护的同时提供较高的挖掘结果可用性。

Patent Agency Ranking