-
公开(公告)号:CN118820469A
公开(公告)日:2024-10-22
申请号:CN202410845741.3
申请日:2024-06-27
Applicant: 哈尔滨工业大学 , 上海浦东发展银行股份有限公司
IPC: G06F16/35 , G06F40/247
Abstract: 本发明提出一种数据分类分级方法,属于数据分类分级技术领域。包括:步骤一、用户向服务器上传待分类数据,并选择不提供具体数据的字段;步骤二、服得到数据字段和内容,当数据字段不含模板数据时执行步骤三,否则执行步骤四;步骤三、利用识别模型对数据进行字段扫描,若输出的结果与模板中某一数据唯一对应,则根据模板中的对应关系,确定字段等级,否则认为字段不属于模板范围内,执行步骤四;步骤四、利用识别模型对数据进行字段扫描,根据输出结果与模板中数据进行匹配形成正则规则数组,正则规则数组表征匹配结果;步骤五、执行匹配流程,得到分类等级;本发明提出了权重匹配函数。能够更加准确的对数据类型进行分类分级。
-
公开(公告)号:CN118820468A
公开(公告)日:2024-10-22
申请号:CN202410845738.1
申请日:2024-06-27
Applicant: 哈尔滨工业大学 , 上海浦东发展银行股份有限公司
IPC: G06F16/35 , G06F21/60 , G06F40/186
Abstract: 一种数据分类分级系统及其数据分类分级方法,属于数据分类技术领域。为改进现有分类分级手段不足的问题,本发明包括应用层、服务层、基础层、数据源层、组件层,所述应用层连接服务层,所述服务层连接基础层,所述基础层分别连接数据源层、组件层,所述服务层包括分类分级引擎、文件识别引擎、系统服务引擎,所述分类分级引擎包括正则匹配模块、大模型智能识别模块,所述文件识别引擎实现对PDF、PPT等文件内容的识别技术,所述系统服务引擎采用Typescript、React、GraphQL和NestJS构建,用于提供系统的核心功能和用户接口。本发明可实现对结构化数据和非结构化数据进行分类分级。
-