-
公开(公告)号:CN119377792A
公开(公告)日:2025-01-28
申请号:CN202411960028.X
申请日:2024-12-30
Applicant: 中电科大数据研究院有限公司 , 太极计算机股份有限公司
IPC: G06F18/2413 , G06F18/213 , G06F18/243
Abstract: 本申请公开了一种数据分级方法、系统及相关装置,用于对数据进行快速且准确的分级。本申请方法包括:获取数据来源信息,基于所述数据来源信息得到数据清单;根据所述数据清单,通过预设分类模型提取目标数据;获取定性要素和定量要素,基于所述定性要素和所述分类模型对所述目标数据进行分级得到初始级别;判断已得到所述初始级别后的所述目标数据是否包含敏感信息;若是,则设定要素权重,基于所述定量要素和所述要素权重对目标数据得到所述目标数据的二次定级,在得到所述目标数据的所述二次定级后,结合所述初始级别对所述二次定级进行调整,最终得到目标数据的目标级别;若否,则将所述目标数据的所述初始级别确定为所述目标级别。
-
公开(公告)号:CN119557424B
公开(公告)日:2025-04-25
申请号:CN202510068377.9
申请日:2025-01-16
Applicant: 中电科大数据研究院有限公司
IPC: G06F16/334 , G06F16/34 , G06F40/284 , G06F40/30 , G06F40/205 , G06N3/042 , G06N3/0464 , G06N3/09
Abstract: 本申请公开了一种数据分析方法、系统以及存储介质,用于自然语言处理领域。本申请方法包括:获取用户输入的自然语言;构建一个将所述自然语言转换为语义查询语句的语义数据模型;将所述语义数据模型结合自定义规则构建语义解析器;将所述自然语言输入所述语义解析器进行解析,以获取语义查询语句;将所述语义查询语句输入语义修正器进行修正,以获取目标语义查询语句;通过语义翻译器将所述目标语义查询语句转换为结构化查询语句;将所述结构化查询语句输入所述数据库进行查询,以获取查询结果。
-
公开(公告)号:CN115982375A
公开(公告)日:2023-04-18
申请号:CN202211546265.2
申请日:2022-12-05
Applicant: 中电科大数据研究院有限公司
Abstract: 本公开的实施例提供一种数据治理方法,具体实现方案为:基于获取的实践案例,构建治理实践案例的参考模型;基于参考模型,生成包括至少一个实践项的实践清单;基于预先收集的最佳实践项以及数据分析时间窗,对实践清单中的实践项进行组合,得到至少一个实践项组合;基于至少一个实践项组合,确定目标实践的生成结果。通过本实施方式,提高了数据治理的效率。
-
公开(公告)号:CN119513636A
公开(公告)日:2025-02-25
申请号:CN202510097821.X
申请日:2025-01-22
Applicant: 中电科大数据研究院有限公司 , 中电科新型智慧城市研究院有限公司
IPC: G06F18/2321 , G06F18/213
Abstract: 本申请公开了一种基于时空数据的聚类分析人群的方法、系统及装置。本申请方法包括:获取时空数据;将时空数据进行特征处理得到特征数量,并基于特征数量构建时空数据矩阵;通过预设分析算法对时空数据矩阵降维得到数据矩阵;根据数据矩阵中的预设点,计算以预设点为中心的预设半径的体积及半径内的点数,并基于半径内的点数和体积计算得到局部密度;计算数据矩阵中每个点与最近目标点的距离,并基于距离和局部密度选择目标邻域半径;基于特征数量确定数据维度,并通过数据维度设置最小点数;根据目标领域半径和最小点数,通过密度聚类算法对数据矩阵中每个点进行标记,得到聚类结果;基于多个聚类簇分析聚类结果的特征。
-
公开(公告)号:CN115718784A
公开(公告)日:2023-02-28
申请号:CN202211384158.4
申请日:2022-11-07
Applicant: 中电科大数据研究院有限公司
Abstract: 本申请公开了一种基于离线同步工具的数据采集方法、装置及储存介质,用于提高数据采集效率。本申请包括:平台通过离线同步工具确定待采集数据的源数据库,并建立与所述源数据库的数据传输通道,所述离线同步工具集成在所述平台内部,所述平台还集成有任务调度器;所述平台根据所述源数据库的类型获取任务调度模板;所述平台根据所述任务调度模板及所述源数据库构建采集任务;所述平台通过所述离线同步工具及所述任务调度器执行所述采集任务;所述平台根据所述采集任务在所述数据传输通道上将所述待采集数据采集到目标数据库中。
-
公开(公告)号:CN119557424A
公开(公告)日:2025-03-04
申请号:CN202510068377.9
申请日:2025-01-16
Applicant: 中电科大数据研究院有限公司
IPC: G06F16/334 , G06F16/34 , G06F40/284 , G06F40/30 , G06F40/205 , G06N3/042 , G06N3/0464 , G06N3/09
Abstract: 本申请公开了一种数据分析方法、系统以及存储介质,用于自然语言处理领域。本申请方法包括:获取用户输入的自然语言;构建一个将所述自然语言转换为语义查询语句的语义数据模型;将所述语义数据模型结合自定义规则构建语义解析器;将所述自然语言输入所述语义解析器进行解析,以获取语义查询语句;将所述语义查询语句输入语义修正器进行修正,以获取目标语义查询语句;通过语义翻译器将所述目标语义查询语句转换为结构化查询语句;将所述结构化查询语句输入所述数据库进行查询,以获取查询结果。
-
公开(公告)号:CN117640644A
公开(公告)日:2024-03-01
申请号:CN202311661015.8
申请日:2023-12-04
Applicant: 中电科大数据研究院有限公司
IPC: H04L67/1004 , H04L67/2885 , H04L67/2895 , H04L67/568 , H04L67/63 , H04L45/76 , H04L43/08 , H04L43/045 , H04L12/66 , H04L67/12
Abstract: 本申请公开了一种涉海类数据交易的负载均衡的处理方法、系统及相关装置,用于最大程度利用服务器性能对请求进行转发处理,实现负载均衡。本申请方法包括:基于定时任务库在网关层上配置定时任务,周期性执行定时任务并动态采集网关层上各个网关节点所在服务器的服务器性能指标;针对各个服务器,基于服务器性能指标计算指标利用率,并将指标利用率存入目标Redis缓存;基于自动活性监测机制,通过硬件层面将用户请求均衡转发至网关层;通过Nignx反向代理层获取第一服务器和第二服务器的负载指标信息,负载指标信息包括:CPU利用率、内存利用率、I/O利用率和带宽利用率;Nignx反向代理层通过预配置的Lua脚本从目标Resis缓存中读取指标利用率,并计算加权负载值。
-
公开(公告)号:CN116028192A
公开(公告)日:2023-04-28
申请号:CN202310315993.0
申请日:2023-03-29
Applicant: 中电科大数据研究院有限公司
Abstract: 本申请公开了一种多源异构数据采集方法、装置和存储介质,旨在通过分布式系统实现通用式多源异构数据采集,提高数据处理效率。本申请方法包括:确定数据源的类型,并配置所述数据源的数据源信息;配置任务调度器,所述任务调度器用于定时执行任务、周期执行任务、确定服务节点以及确定执行策略;创建数据采集任务,所述数据采集任务包括数据来源、数据目标源以及数据采集策略;通过配置好的任务调度器,按照所述数据采集策略执行所述数据采集任务;输出数据采集结果。
-
公开(公告)号:CN115829371A
公开(公告)日:2023-03-21
申请号:CN202211387954.3
申请日:2022-11-07
Applicant: 中电科大数据研究院有限公司
IPC: G06Q10/0639 , G06Q50/26
Abstract: 本申请公开了一种应用于政务领域的数据质量评估方法及相关装置,用于用于使政务领域的数据质量评估可量化、可落地且可迭代。本申请方法包括:根据政务领域的业务场景确定数据质量评价指标;基于数据质量评价指标确定指标约束规则;根据数据质量评价指标及指标约束规则构建数据质量评估算法模型;获取待评估的政务领域的目标数据集,并确定目标数据集对应的目标数据质量评价指标及目标指标约束规则,政务领域的目标数据集为目标职能部门在办理目标业务及进行目标决策时产生的数据;确定目标指标约束规则的目标权重值;将目标指标约束规则、目标权重值及目标数据集输入数据质量评估算法模型,获取目标数据集的数据质量评估结果。
-
-
-
-
-
-
-
-