一种基于大数据查找文档间差异的方法及装置

    公开(公告)号:CN119886102A

    公开(公告)日:2025-04-25

    申请号:CN202411891136.6

    申请日:2024-12-20

    Abstract: 本发明公开一种基于大数据查找文档间差异的方法及装置,涉及电数字数据处理技术领域。该方法包括:获取格式解析后的待查找文档,对所述待查找文档中的文本内容进行预处理;基于文本对比算法对预处理后的文本内容进行差异识别,并获取复杂性评估指标,根据复杂性评估指标确定差异识别结果,将差异识别结果通过高亮显示进行可视化;根据高亮显示的可视化结果,调整文本对比算法的参数,根据调整后的文本对比算法重新进行差异识别,获取文档差异分数;所述文档差异分数用于衡量待查找文档之间的差异程度。采用本发明,实现了文档之间差异内容查找准确度的提高,解决了现有技术中文档间差异内容查找不充分的问题。

Patent Agency Ranking