一种高效的流数据模式挖掘方法

    公开(公告)号:CN109558424B

    公开(公告)日:2023-04-18

    申请号:CN201811304324.9

    申请日:2018-11-03

    Applicant: 复旦大学

    Abstract: 本发明属于数据挖掘技术领域,具体是一种高效的流数据模式挖掘方法。本发明采用最小化验证误差模型来作为聚类划分标准,分两步找出流数据中的隐藏模型。第一步为序列聚类,即:基于增强动态规划方法,找出将数据流划分为多个连续数据段的最优划分;第二步为迭代聚类,即:基于期望最大化方法的工作原理和最优划分的数据段特征,对数据段进行迭代聚类,进而找出流数据中的隐藏模型。实验结果表明,本发明能够对流数据进行有效划分与聚类,错误率较低,且运行时间与数据集大小和数据段多少呈线性相关,效率较高。

    一种高效的流数据模式挖掘方法

    公开(公告)号:CN109558424A

    公开(公告)日:2019-04-02

    申请号:CN201811304324.9

    申请日:2018-11-03

    Applicant: 复旦大学

    CPC classification number: G06K9/6268 G06K9/6218

    Abstract: 本发明属于数据挖掘技术领域,具体是一种高效的流数据模式挖掘方法。本发明采用最小化验证误差模型来作为聚类划分标准,分两步找出流数据中的隐藏模型。第一步为序列聚类,即:基于增强动态规划方法,找出将数据流划分为多个连续数据段的最优划分;第二步为迭代聚类,即:基于期望最大化方法的工作原理和最优划分的数据段特征,对数据段进行迭代聚类,进而找出流数据中的隐藏模型。实验结果表明,本发明能够对流数据进行有效划分与聚类,错误率较低,且运行时间与数据集大小和数据段多少呈线性相关,效率较高。

Patent Agency Ranking