一种数据分级方法、系统及相关装置

    公开(公告)号:CN119377792A

    公开(公告)日:2025-01-28

    申请号:CN202411960028.X

    申请日:2024-12-30

    Abstract: 本申请公开了一种数据分级方法、系统及相关装置,用于对数据进行快速且准确的分级。本申请方法包括:获取数据来源信息,基于所述数据来源信息得到数据清单;根据所述数据清单,通过预设分类模型提取目标数据;获取定性要素和定量要素,基于所述定性要素和所述分类模型对所述目标数据进行分级得到初始级别;判断已得到所述初始级别后的所述目标数据是否包含敏感信息;若是,则设定要素权重,基于所述定量要素和所述要素权重对目标数据得到所述目标数据的二次定级,在得到所述目标数据的所述二次定级后,结合所述初始级别对所述二次定级进行调整,最终得到目标数据的目标级别;若否,则将所述目标数据的所述初始级别确定为所述目标级别。

    一种自适应的物联网数据管理方法及相关设备

    公开(公告)号:CN117453789A

    公开(公告)日:2024-01-26

    申请号:CN202311595453.9

    申请日:2023-11-27

    Abstract: 本申请实施例公开了一种自适应的物联网数据管理方法及相关设备,可根据接入数据量的大小,并基于不同的时序数据库、感知数据库、数据仓库来实现对物联网数据的统一管理,有效减少资源的浪费,从而满足物联网数据的管理需求。本申请包括:获取目标物联网数据,所述目标物联网数据包括物联网数据源信息和实时的物联网数据信息;确定单位时间内获取到的所述目标物联网数据的数据总量以及每秒获取所述目标物联网数据的速率;使用Z‑分数计算所述数量总量的第一偏离分数和所述每秒获取所述目标物联网数据的速率的第二偏离分数;根据所述第一偏离分数和所述第二偏离分数计算总偏离分数;根据所述总偏离分数确定目标阈值。

    一种网页信息分类方法、装置及存储介质

    公开(公告)号:CN119003920A

    公开(公告)日:2024-11-22

    申请号:CN202411481452.6

    申请日:2024-10-23

    Abstract: 本申请公开了一种网页信息分类方法、装置及存储介质,用于信息分类领域。本申请方法包括:使用Python的Scrapy库从目标网页获取网页中的静态数据;使用Selenium自动化工具从目标网页获取网页的动态数据;基于所述静态数据和所述动态数据构建DOM树形结构;使用XLM‑RoBERTa预训练语言模型对已构建DOM树形结构的所述静态数据和所述动态数据进行向量化,转化为数值向量;将DOM树形结构转换为图结构,并将数值向量输入卷积图神经网络模型中,通过卷积图神经网络模型对图结构进行编码,生成特征向量;将所述特征向量输入预配置的分类模型中进行计算,通过预配置的分类模型对所述静态数据和所述动态数据进行分类。

    一种基于Flink动态水位线调整的方法及相关设备

    公开(公告)号:CN117609751A

    公开(公告)日:2024-02-27

    申请号:CN202311559810.6

    申请日:2023-11-20

    Abstract: 本申请公开了一种基于Flink动态水位线调整的方法及相关设备,用于动态的调整Flink水位线,无需使用人工进行干预,且该策略可以根据具体业务需求进行灵活配置和优化,适应不同业务场景下的数据处理要求,具有通用性,从而提高数据的准确性,可满足不同延迟要求和实际情况下窗口计算结果准确性需求。本申请方法包括:从流式数据源中采集目标数据集合,所述目标数据集合中包含有多个流式时间序列数据;构建初始时间训练模型,所述初始时间训练中内嵌有LSTM时间序列模型;将所述目标数据集合输入所述初始时间训练模型中训练并生成目标时间训练模型;获取多个目标流式时间序列数据。

Patent Agency Ranking