-
公开(公告)号:CN115935944A
公开(公告)日:2023-04-07
申请号:CN202211002609.3
申请日:2022-08-19
Applicant: 山东省计算中心(国家超级计算济南中心) , 齐鲁工业大学
IPC: G06F40/205 , G06F40/226 , G06F40/186 , G06F16/903 , G06F16/958
Abstract: 本发明公开一种跨平台的标准文件树形结构生成方法与展示控件。其步骤是:获取输入数据数组;遍历输入数据数组,根据每一条数据标题层级生成树形数据;将树形数据输入到控件预设数据接收接口;触发界面渲染,将所述树形数据根据层级从根节点开始,依次遍历所有子节点数据展示到页面上。本发明提供的树形控件至少应包含一个节点,渲染过程中采用懒加载机制,不必一次性将所有节点渲染完,等到监听到点击事件时才进行剩余部分的渲染。这样保证了不会因为一次渲染太多节点而导致页面阻塞。本发明适用标准文件数字化领域,用以解决标准文件关键信息提取效率低下、内容阅读体验差的缺点,具有提取准确度高、结构化清晰、渲染性能高的优点。
-
公开(公告)号:CN115424282A
公开(公告)日:2022-12-02
申请号:CN202211188303.1
申请日:2022-09-28
Applicant: 山东省计算中心(国家超级计算济南中心) , 齐鲁工业大学
IPC: G06V30/413 , G06V30/18 , G06V10/82 , G06N3/08 , G06N3/04
Abstract: 本发明提供了一种非结构化文本(包括所有格式的办公文档、文本、图片、各种报表和图像等)表格识别方法,涉及文本识别领域,该方法包括:采集数据集,首先把非结构化文本转化为图像类集合,然后对集合进行图像预处理,把图像集合作为数据集导入模型,对图像数据集的信息进行分析,检测出表格区域,把图像转换成序列,进行表格结构序列预测,检测出表格行结构,进行表格行识别,表格行单元格识别后,识别结果经过后处理,融合表格行结构和单元格文本内容,最终通过文本框和单元格内容进行匹配得到Excel形式的表格识别数据。该方法通过特征学习训练了模型,实现了非结构化文本数据信息的智能提取,有利于非结构化文本数据的进一步分析和实际应用,极大地节省了人力成本提高了工作效率,在一定程度上提高了表格检测速度和准确率,使用本发明所述的方法和系统,可以通过转化进行非结构化文本内容的分析和信息的识别提取,使得非结构化文本在各行各业中具有更好的实用价值和应用。
-
公开(公告)号:CN115392214A
公开(公告)日:2022-11-25
申请号:CN202211035627.1
申请日:2022-08-26
Applicant: 山东省计算中心(国家超级计算济南中心) , 齐鲁工业大学
IPC: G06F40/205 , G06F40/268 , G06F40/295 , G06K9/62 , G06N3/04 , G06N3/08
Abstract: 本发明公开了一种基于文本生成的数据增强方法、系统及存储介质,该方法以原始文本数据集为基础,通过自然语言处理技术实现文本生成,得到增强数据集。包括:获取某文本数据集,将文本合集中的文本内容作为文本数据增强的原始数据上传至临时存储区中;获取临时存储区中的文本内容,进行原始文本数据进行数据预处理和分句、分词和词性标注;对分词后的原始语句进行关键词抽取、命名实体识别,根据分词识别结果完成原始语句的分词状态标注;将带有分词状态标注的原始分词语句输入到文本生成模型生成目标增强语句;将原始语句集和目标增强语句集进行汇总,得到增强数据集。本发明有效地缓解了自然语言处理任务中数据量少、有效数据稀疏性等问题。
-
公开(公告)号:CN112435151A
公开(公告)日:2021-03-02
申请号:CN202011356149.5
申请日:2020-11-27
Applicant: 山东省计算中心(国家超级计算济南中心) , 齐鲁工业大学
Abstract: 本公开提出了一种基于关联分析的政务信息数据处理方法及系统,包括:通过局域网子网发送指令信息,调用政务数据服务器中的指令数据;判断指令数据是否为所调用的指令信息并进行权限判断,对于符合权限要求的允许进行数据读取操作;对获取的数据进行清洗及预处理,将政务公开关键指标数据进行划分,划分结果存储在第一数据列表中;将政务公开关键指标中与经济社会发展相关指标进行处理并进行主成分分析,再将数据进行指标划分,获得第二数据列表;调用第一数据列表及第二数据列表并进行数据关联分析,获得数据间的关联结果。本公开技术方案将不同的政务指标数据进行了关联处理,获得数据之间的关联性。
-
公开(公告)号:CN118196089A
公开(公告)日:2024-06-14
申请号:CN202410605255.4
申请日:2024-05-16
Applicant: 山东省计算中心(国家超级计算济南中心) , 齐鲁工业大学(山东省科学院)
IPC: G06T7/00 , G06V10/764 , G06V10/82 , G06N3/096
Abstract: 本发明属于视觉缺陷检测领域,提供了一种基于知识蒸馏的玻璃容器缺陷检测网络轻量化方法及系统,包括对玻璃容器缺陷图片进行缺陷类别筛选、标注和数据预处理;采用搭建置信度蒸馏分支,训练教师模型得到教师模型权重,将训练好的教师模型进行推理,从教师模型取出置信度最高且互不重叠的多个预测框并训练学生模型进行置信度蒸馏;搭建全局蒸馏分支,训练教师模型得到教师模型权重,将训练好的教师模型进行推理,从教师模型取出多尺度特征并重新加载和训练好的学生模型权重进行全局蒸馏;利用置信度蒸馏分支和全局蒸馏分支实现对缺陷检测网络的轻量化。
-
公开(公告)号:CN116992870A
公开(公告)日:2023-11-03
申请号:CN202311242919.7
申请日:2023-09-26
Applicant: 山东省计算中心(国家超级计算济南中心) , 齐鲁工业大学(山东省科学院)
IPC: G06F40/279 , G06F16/28 , G06F17/16 , G06N3/0464 , G06N3/08
Abstract: 本发明公开一种基于非对称核函数的文本信息实体关系抽取方法及系统,涉及实体关系抽取技术领域,包括:获取目标文本的句子向量、实体掩码和关系掩码;所述关系掩码中包括实体词的掩码、处于实体词窗口内的周围词的动态掩码和处于实体词窗口外的边缘词的掩码;对句子向量进行特征编码;根据得到的特征向量和实体掩码得到实体向量,根据特征向量和关系掩码得到关系向量,将实体向量和关系向量作为参数以构建非对称核函数;根据非对称核函数确定目标实体对与每个关系的关联度,由此确定目标实体对在目标文本中的关系。实现对关系语义的聚焦,具有良好的可解释性。
-
公开(公告)号:CN112435151B
公开(公告)日:2023-05-12
申请号:CN202011356149.5
申请日:2020-11-27
Applicant: 山东省计算中心(国家超级计算济南中心) , 齐鲁工业大学
IPC: G06Q10/0639 , G06F21/62 , H04L9/40 , G06Q50/26 , G06F21/60 , G06F16/215
Abstract: 本公开提出了一种基于关联分析的政务信息数据处理方法及系统,包括:通过局域网子网发送指令信息,调用政务数据服务器中的指令数据;判断指令数据是否为所调用的指令信息并进行权限判断,对于符合权限要求的允许进行数据读取操作;对获取的数据进行清洗及预处理,将政务公开关键指标数据进行划分,划分结果存储在第一数据列表中;将政务公开关键指标中与经济社会发展相关指标进行处理并进行主成分分析,再将数据进行指标划分,获得第二数据列表;调用第一数据列表及第二数据列表并进行数据关联分析,获得数据间的关联结果。本公开技术方案将不同的政务指标数据进行了关联处理,获得数据之间的关联性。
-
公开(公告)号:CN115344414A
公开(公告)日:2022-11-15
申请号:CN202210974407.9
申请日:2022-08-15
Applicant: 山东省计算中心(国家超级计算济南中心) , 齐鲁工业大学
Abstract: 本发明提供了一种日志异常检测方法及系统,应用于系统的日志异常检测领域。该系统使用Drain、Word2Vec、TF‑IDF算法以及LSTM和Transformer模型。所述系统包括:首先使用Drain对日志进行解析;然后使用Word2Vec生成词向量,并使用TF‑IDF生成加权日志序列特征向量和组件值特征向量;最后,使用一个添加了LSTM的Transformer作为最终的分类模型。本发明不仅能捕获日志中的语义信息和顺序关系,而且还能考虑组件值的信息,进而能够发现多种类型的系统异常,减少系统崩溃次数。本发明以较低的计算成本来解决日志异常检测的不稳定性问题,提高异常检测的准确性和效率,提高应对异常的能力,保证系统运行的安全。
-
公开(公告)号:CN114706559A
公开(公告)日:2022-07-05
申请号:CN202210319424.9
申请日:2022-03-29
Applicant: 山东省计算中心(国家超级计算济南中心) , 齐鲁工业大学
Abstract: 本发明公开了一种基于需求识别的软件规模度量方法。该方法以软件的需求规范文档为基础,获取软件需求并进行需求分类,通过对功能需求中的功能点识别统计得到软件规模。包括:获取目标软件的需求规范文档;对目标软件需求文档进行数据预处理,得到需求语句数据;使用图注意力网络和BERT构建自动需求分类模型进行需求识别分类;对功能需求则进行功能点规模计算,对非功能需求进行属性嵌入和全局统计;最后以功能点规模估算为主,全局非功能需求分类统计和系统特性作为调整系数完成软件规模度量。
-
公开(公告)号:CN114697108A
公开(公告)日:2022-07-01
申请号:CN202210318745.7
申请日:2022-03-29
Applicant: 山东省计算中心(国家超级计算济南中心) , 齐鲁工业大学
IPC: H04L9/40 , H04L41/142 , G06K9/62
Abstract: 本发明提供了一种系统日志异常检测方法,应用于系统的日志异常检测领域。该方法结合了Drain算法、TF‑IDF算法以及多种异常检测模型,最终使用投票融合。所述方法包括:获取原始日志数据;提取变量,保存常量为模板,将日志解析为结构化文本;特征提取,将字符串转化为可量化的数字;将经过处理后的日志数据输入日志检测模型组,得到预测结果;对日志检测模型输出的检测结果进行投票融合,并输出日志异常检测结果。本发明通过对多个检测结果进行投票融合,能够及时发现系统日志中记录的异常模式,以便对系统的异常进行部署,提高预测结果的准确性,帮助人工完成快速的异常筛查,满足对系统日志异常检测的需求,降低系统运行的成本。
-
-
-
-
-
-
-
-
-