-
公开(公告)号:CN118484698A
公开(公告)日:2024-08-13
申请号:CN202410500259.6
申请日:2024-04-24
Applicant: 东莞理工学院
IPC: G06F18/24 , G06F16/906 , G06F16/903 , G06F40/295 , G06F18/213 , G06N3/0442 , G06F18/2413
Abstract: 本发明提供了一种基于标准规则匹配的新能源汽车行业数据分类分级方法,包括以下步骤:步骤S1、根据新能源汽车行业形成的分类分级标准,构建规则特征库;步骤S2、通过数据关键字段映射算法,将新能源行业业务数据映射为特定字段,并与规则特征库进行匹配;步骤S3、将数据映射出的特定字段与规则特征库进行比对,得到数据的重要级别。本发明从行业标准中提取识别规则与向量,进一步将数据映射到标准规则上,能够实现准确、可解释的数据分类分级,为新能源汽车行业数据安全监管提供支撑。
-
公开(公告)号:CN117951298A
公开(公告)日:2024-04-30
申请号:CN202311644404.X
申请日:2023-12-04
Applicant: 东莞理工学院
IPC: G06F16/35 , G06F40/284 , G06N3/045
Abstract: 本发明公开了一种基于关键词提取的重要数据文本识别技术,包括:获取包含各种重要度级别的文本数据,对文本数据进行预处理,将预处理后的文本数据划分为训练集和测试集;将训练集中的文本数据输入到基于BERT模型的关键词提取网络中,计算可能的关键词;将获取关键词的特征输入到重要数据分类网络中,并结合注意力机制进行重要程度级别的判定;本发明涉及自然语言处理技术领域。该基于关键词提取的重要数据文本识别技术,通过结合关键词提取和重要数据文本分类两项任务,训练出的模型能够对重要数据相关的关键词更加敏感,从而提取出与重要数据分类结果相关的关键词,在提供准确分类效果的同时,还能够满足现实场景的可解释性需求。
-