一种数据分类分级标准文件自动化解析的方法及系统

    公开(公告)号:CN118395968A

    公开(公告)日:2024-07-26

    申请号:CN202410562917.4

    申请日:2024-05-08

    Abstract: 本发明公开了一种数据分类分级标准文件的自动解析化方法及系统,属于数据安全的自动合规领域,本方法从标准文件中识别关键的指导语句,抽取数据的上下位关系和安全等级属性,形成了一个清晰的数据分类分级图谱。通过自动构建相关领域词典,以提升该领域的自然语言处理能力,并将领域知识与预训练模型融合,提升了模型信息抽取准确率。通过实验证明,构建的领域词典对于术语识别和文本分类任务具有明显提升。本文所提出的文本分类方法表现出高效性能,准确率达到96.66%,优于现有的方法。构建的知识库信息类型覆盖率超过85%。该框架旨在为数据从业者提供更直观的数据分类分级决策建议,从而确保重要数据的安全与合规。

Patent Agency Ranking