一种跨平台的标准文件树形结构生成方法与展示控件

    公开(公告)号:CN115935944A

    公开(公告)日:2023-04-07

    申请号:CN202211002609.3

    申请日:2022-08-19

    Abstract: 本发明公开一种跨平台的标准文件树形结构生成方法与展示控件。其步骤是:获取输入数据数组;遍历输入数据数组,根据每一条数据标题层级生成树形数据;将树形数据输入到控件预设数据接收接口;触发界面渲染,将所述树形数据根据层级从根节点开始,依次遍历所有子节点数据展示到页面上。本发明提供的树形控件至少应包含一个节点,渲染过程中采用懒加载机制,不必一次性将所有节点渲染完,等到监听到点击事件时才进行剩余部分的渲染。这样保证了不会因为一次渲染太多节点而导致页面阻塞。本发明适用标准文件数字化领域,用以解决标准文件关键信息提取效率低下、内容阅读体验差的缺点,具有提取准确度高、结构化清晰、渲染性能高的优点。

    一种非结构化文本表格识别方法和系统

    公开(公告)号:CN115424282A

    公开(公告)日:2022-12-02

    申请号:CN202211188303.1

    申请日:2022-09-28

    Abstract: 本发明提供了一种非结构化文本(包括所有格式的办公文档、文本、图片、各种报表和图像等)表格识别方法,涉及文本识别领域,该方法包括:采集数据集,首先把非结构化文本转化为图像类集合,然后对集合进行图像预处理,把图像集合作为数据集导入模型,对图像数据集的信息进行分析,检测出表格区域,把图像转换成序列,进行表格结构序列预测,检测出表格行结构,进行表格行识别,表格行单元格识别后,识别结果经过后处理,融合表格行结构和单元格文本内容,最终通过文本框和单元格内容进行匹配得到Excel形式的表格识别数据。该方法通过特征学习训练了模型,实现了非结构化文本数据信息的智能提取,有利于非结构化文本数据的进一步分析和实际应用,极大地节省了人力成本提高了工作效率,在一定程度上提高了表格检测速度和准确率,使用本发明所述的方法和系统,可以通过转化进行非结构化文本内容的分析和信息的识别提取,使得非结构化文本在各行各业中具有更好的实用价值和应用。

    一种基于文本生成的数据增强方法、系统及存储介质

    公开(公告)号:CN115392214A

    公开(公告)日:2022-11-25

    申请号:CN202211035627.1

    申请日:2022-08-26

    Abstract: 本发明公开了一种基于文本生成的数据增强方法、系统及存储介质,该方法以原始文本数据集为基础,通过自然语言处理技术实现文本生成,得到增强数据集。包括:获取某文本数据集,将文本合集中的文本内容作为文本数据增强的原始数据上传至临时存储区中;获取临时存储区中的文本内容,进行原始文本数据进行数据预处理和分句、分词和词性标注;对分词后的原始语句进行关键词抽取、命名实体识别,根据分词识别结果完成原始语句的分词状态标注;将带有分词状态标注的原始分词语句输入到文本生成模型生成目标增强语句;将原始语句集和目标增强语句集进行汇总,得到增强数据集。本发明有效地缓解了自然语言处理任务中数据量少、有效数据稀疏性等问题。

    基于LSTM-Transformer的日志异常检测方法及系统

    公开(公告)号:CN115344414A

    公开(公告)日:2022-11-15

    申请号:CN202210974407.9

    申请日:2022-08-15

    Abstract: 本发明提供了一种日志异常检测方法及系统,应用于系统的日志异常检测领域。该系统使用Drain、Word2Vec、TF‑IDF算法以及LSTM和Transformer模型。所述系统包括:首先使用Drain对日志进行解析;然后使用Word2Vec生成词向量,并使用TF‑IDF生成加权日志序列特征向量和组件值特征向量;最后,使用一个添加了LSTM的Transformer作为最终的分类模型。本发明不仅能捕获日志中的语义信息和顺序关系,而且还能考虑组件值的信息,进而能够发现多种类型的系统异常,减少系统崩溃次数。本发明以较低的计算成本来解决日志异常检测的不稳定性问题,提高异常检测的准确性和效率,提高应对异常的能力,保证系统运行的安全。

    一种基于需求识别的软件规模度量方法

    公开(公告)号:CN114706559A

    公开(公告)日:2022-07-05

    申请号:CN202210319424.9

    申请日:2022-03-29

    Abstract: 本发明公开了一种基于需求识别的软件规模度量方法。该方法以软件的需求规范文档为基础,获取软件需求并进行需求分类,通过对功能需求中的功能点识别统计得到软件规模。包括:获取目标软件的需求规范文档;对目标软件需求文档进行数据预处理,得到需求语句数据;使用图注意力网络和BERT构建自动需求分类模型进行需求识别分类;对功能需求则进行功能点规模计算,对非功能需求进行属性嵌入和全局统计;最后以功能点规模估算为主,全局非功能需求分类统计和系统特性作为调整系数完成软件规模度量。

    基于集成学习的系统日志异常检测方法

    公开(公告)号:CN114697108A

    公开(公告)日:2022-07-01

    申请号:CN202210318745.7

    申请日:2022-03-29

    Abstract: 本发明提供了一种系统日志异常检测方法,应用于系统的日志异常检测领域。该方法结合了Drain算法、TF‑IDF算法以及多种异常检测模型,最终使用投票融合。所述方法包括:获取原始日志数据;提取变量,保存常量为模板,将日志解析为结构化文本;特征提取,将字符串转化为可量化的数字;将经过处理后的日志数据输入日志检测模型组,得到预测结果;对日志检测模型输出的检测结果进行投票融合,并输出日志异常检测结果。本发明通过对多个检测结果进行投票融合,能够及时发现系统日志中记录的异常模式,以便对系统的异常进行部署,提高预测结果的准确性,帮助人工完成快速的异常筛查,满足对系统日志异常检测的需求,降低系统运行的成本。

Patent Agency Ranking