基于分布式文件系统的相似文件查找方法、系统及装置

    公开(公告)号:CN113886341A

    公开(公告)日:2022-01-04

    申请号:CN202111167857.9

    申请日:2021-09-29

    Abstract: 本发明提出的一种基于分布式文件系统的相似文件查找方法、系统及装置,所述方法包括:在用户终端上进行打开文件操作时,在所属服务器上生成相应的终端节点,并根据所打开的文件添加对应的文件节点信息;使用预设的相似性算法对终端节点上的文件节点进行一一对比,得出任意文件节点的相似性数值;读取待查找的文件;遍历所有的主机节点以及文件节点,若文件节点存储的待查找的文件的相似性数值大于预设相似度阈值,则标记此文件节点;根据标记的文件节点生成终端节点分布图。本发明能够通过每个终端用户打开文件时上报的文件数据,形成相似性分析路径拓扑图,利用相似性分析路径拓扑图可以快速的定位出存储有待查找的文件数据的终端设备。

Patent Agency Ranking