一种时序数据离群点检测方法

    公开(公告)号:CN102360378A

    公开(公告)日:2012-02-22

    申请号:CN201110307662.X

    申请日:2011-10-10

    Applicant: 南京大学

    Abstract: 本发明公开了一种时序数据离群点检测方法,包括以下步骤:将训练数据集中的时序数据按星期一到星期日划分进行聚类;使用每次聚类结果中最大的簇构建时序数据在星期粒度下的数据分布模型;根据所述数据分布模型,找出训练数据集中所有的异常值,分别求出各个时段的数据分布模型;查找符合各个时段的数据分布模型的异常值中,是否存在以大于星期粒度的时间粒度为周期发生的周期事件,如果存在,将其记录下来,作为一类特殊周期模式;判断测试数据集中的时序数据是否符合星期模式,如果符合,则判定该时序数据为非离群点;否则,判断该时序数据是否符合特殊周期模式,如果符合,则判定该时序数据为非离群点,否则判定该时序数据为离群点。

Patent Agency Ranking