-
公开(公告)号:CN107704772A
公开(公告)日:2018-02-16
申请号:CN201711034364.1
申请日:2017-10-30
Applicant: 中国人民解放军信息工程大学
CPC classification number: G06F21/6218 , G06F16/182 , G06F16/1844 , G06F16/1865
Abstract: 本发明公开了一种针对HDFS的数据窃取检测方法及装置,该方法包括:通过已生成的待检测文件夹的检测数据集,提取出待检测文件夹中每一个待检测文件的最近访问时间和创建时间,并通过最近访问时间、创建时间和检测时刻的关系以及最近访问时间和预设的复制结束时刻的关系,确定文件所属的类别;根据属于截止簇的文件的数量和在检测时刻待检测文件夹中所有文件的数量计算复制比例;通过复制比例与复制阈值的关系,以及在检测时刻待检测文件夹中所有文件数量与数量阈值的关系,确定文件是否存在已被复制的风险。因此,实现了对文件批量复制行为的量化检测,并且,采用MapReduce并行处理方式,提高了检测的速度。