-
公开(公告)号:CN119513050A
公开(公告)日:2025-02-25
申请号:CN202411580099.7
申请日:2024-11-07
Applicant: 北京交通大学
Abstract: 本发明公开了一种基于大数据的计算机数据分析处理方法,属于数据处理技术领域,具体包括:采集计算机空间中的所有存储数据,筛选出大于预设字节量的存储数据,标记为待定存储数据;将待定存储数据划分为文本数据和视频数据,对文本数据和视频数据分别进行去重处理,筛选出重复的多余文本和视频数据;获取去重后的待定存储数据的评价指标,所述评价指标包括但不限于上次读取距今天数、读取频率和字节大小,将评价指标转换为极大型指标,基于优劣解距离法计算每个待定存储数据的分值F,将分值靠前的若干个待定存储数据标记为推荐清理数据;本发明实现了对计算机存储空间重复数据的大规模快速分析。