-
公开(公告)号:CN115277858A
公开(公告)日:2022-11-01
申请号:CN202211166164.2
申请日:2022-09-23
Applicant: 太极计算机股份有限公司 , 中电科大数据研究院有限公司
IPC: H04L67/60 , H04L67/561 , H04L67/563 , H04L47/50 , G06F16/13 , G06F16/172 , G06F16/182
Abstract: 本发明涉及信息处理领域,公开了一种大数据的数据处理方法和系统,所述方法包括设置名称节点,数据节点和用户端,其中,所述名称节点被配置为中心管理服务器,将描述性元数据以列表形式存储在名称节点的内存中,响应于用户端对文件的访问请求,提供内部元数据服务;在所述名称节点处,设置有静态缓存队列,所述静态缓存队列,存储对应热点文件的分块访问数据,以及在数据节点设置重定向消息,将数据的访问和地址变更能够及时反馈到用户端,实现了用户对数据节点信息的访问的快捷性。
-
公开(公告)号:CN119227120A
公开(公告)日:2024-12-31
申请号:CN202411779051.9
申请日:2024-12-05
Applicant: 中电科大数据研究院有限公司 , 太极计算机股份有限公司
IPC: G06F21/60 , G06F16/22 , G06F16/245 , G06F16/28
Abstract: 本申请公开了一种基于可信空间的可信数据交换方法、装置及存储介质。本申请方法包括:数据提供方将数据上传至可信数据空间;数据供给平台生成合约,合约包含签约时间戳、数据标识符、数据提供方标识符、数据使用方标识符、使用权限、使用期限、数据修改限制和控制策略;对合约信息进行哈希加密,并将合约信息存储于目标区块链中;将摩斯码中的“点”、“横”及“间隔”分别映射为零宽度非连接符、零宽度连接符及零宽度空格符,将加密后的合约标识符转换为摩斯码格式;在上传的数据信息的随机位置嵌入零宽度非连接符、零宽度连接符及零宽度空格符,加密秘钥基于预设的加密算法生成;使用加密密钥对上传的数据信息进行加密。
-
公开(公告)号:CN116150405B
公开(公告)日:2023-06-27
申请号:CN202310416643.3
申请日:2023-04-19
Applicant: 中电科大数据研究院有限公司 , 太极计算机股份有限公司
Abstract: 本发明提供一种多场景的异构数据处理方法,包括:从不同场景下的第一知识图谱和第二知识图谱中各个文本实体的邻居子图中提取图结构信息,获取文本实体的结构拓扑特征;从第一知识图谱和第二知识图谱的各三元组中获取连接各个文本实体的实体关系的关系特征;融合第一知识图谱和第二知识图谱中各个文本实体的结构拓扑特征和连接对应文本实体的实体关系的关系特征,得到各个文本实体的第一实体表示;基于第一知识图谱中任一文本实体的第一实体表示与第二知识图谱中任一文本实体的第一实体表示之间的相似度,构建第一实体对齐概率矩阵;基于第一实体对齐概率矩阵,确定第一知识图谱和第二知识图谱的对齐实体对。本发明提升了异构数据融合的准确性。
-
公开(公告)号:CN119377792A
公开(公告)日:2025-01-28
申请号:CN202411960028.X
申请日:2024-12-30
Applicant: 中电科大数据研究院有限公司 , 太极计算机股份有限公司
IPC: G06F18/2413 , G06F18/213 , G06F18/243
Abstract: 本申请公开了一种数据分级方法、系统及相关装置,用于对数据进行快速且准确的分级。本申请方法包括:获取数据来源信息,基于所述数据来源信息得到数据清单;根据所述数据清单,通过预设分类模型提取目标数据;获取定性要素和定量要素,基于所述定性要素和所述分类模型对所述目标数据进行分级得到初始级别;判断已得到所述初始级别后的所述目标数据是否包含敏感信息;若是,则设定要素权重,基于所述定量要素和所述要素权重对目标数据得到所述目标数据的二次定级,在得到所述目标数据的所述二次定级后,结合所述初始级别对所述二次定级进行调整,最终得到目标数据的目标级别;若否,则将所述目标数据的所述初始级别确定为所述目标级别。
-
公开(公告)号:CN116150405A
公开(公告)日:2023-05-23
申请号:CN202310416643.3
申请日:2023-04-19
Applicant: 中电科大数据研究院有限公司 , 太极计算机股份有限公司
Abstract: 本发明提供一种多场景的异构数据处理方法,包括:从不同场景下的第一知识图谱和第二知识图谱中各个文本实体的邻居子图中提取图结构信息,获取文本实体的结构拓扑特征;从第一知识图谱和第二知识图谱的各三元组中获取连接各个文本实体的实体关系的关系特征;融合第一知识图谱和第二知识图谱中各个文本实体的结构拓扑特征和连接对应文本实体的实体关系的关系特征,得到各个文本实体的第一实体表示;基于第一知识图谱中任一文本实体的第一实体表示与第二知识图谱中任一文本实体的第一实体表示之间的相似度,构建第一实体对齐概率矩阵;基于第一实体对齐概率矩阵,确定第一知识图谱和第二知识图谱的对齐实体对。本发明提升了异构数据融合的准确性。
-
公开(公告)号:CN114969018B
公开(公告)日:2022-11-08
申请号:CN202210913441.5
申请日:2022-08-01
Applicant: 太极计算机股份有限公司 , 中电科大数据研究院有限公司
IPC: G06F16/215 , G06F16/901 , G06F16/906 , G06N5/02
Abstract: 本发明实施例提供一种数据监控方法及系统,其中方法包括:确定待监控的当前数据治理平台的融合数据;将所述待监控的当前数据治理平台的融合数据输入至数据监控模型中,得到所述数据监控模型输出的数据监控结果;其中,所述数据监控模型是基于对当前数据治理平台的样本融合数据进行分类分级后生成知识图谱和质量知识库后得到的。本发明有效解决了目前数据治理平台存在的数据分类分级及质量管控工作中数据难以治理的问题。
-
公开(公告)号:CN119227120B
公开(公告)日:2025-04-04
申请号:CN202411779051.9
申请日:2024-12-05
Applicant: 中电科大数据研究院有限公司 , 太极计算机股份有限公司
IPC: G06F21/60 , G06F16/22 , G06F16/245 , G06F16/28
Abstract: 本申请公开了一种基于可信空间的可信数据交换方法、装置及存储介质。本申请方法包括:数据提供方将数据上传至可信数据空间;数据供给平台生成合约,合约包含签约时间戳、数据标识符、数据提供方标识符、数据使用方标识符、使用权限、使用期限、数据修改限制和控制策略;对合约信息进行哈希加密,并将合约信息存储于目标区块链中;将摩斯码中的“点”、“横”及“间隔”分别映射为零宽度非连接符、零宽度连接符及零宽度空格符,将加密后的合约标识符转换为摩斯码格式;在上传的数据信息的随机位置嵌入零宽度非连接符、零宽度连接符及零宽度空格符,加密秘钥基于预设的加密算法生成;使用加密密钥对上传的数据信息进行加密。
-
公开(公告)号:CN115277858B
公开(公告)日:2022-12-20
申请号:CN202211166164.2
申请日:2022-09-23
Applicant: 太极计算机股份有限公司 , 中电科大数据研究院有限公司
IPC: H04L67/60 , H04L67/561 , H04L67/563 , H04L47/50 , G06F16/13 , G06F16/172 , G06F16/182
Abstract: 本发明涉及信息处理领域,公开了一种大数据的数据处理方法和系统,所述方法包括设置名称节点,数据节点和用户端,其中,所述名称节点被配置为中心管理服务器,将描述性元数据以列表形式存储在名称节点的内存中,响应于用户端对文件的访问请求,提供内部元数据服务;在所述名称节点处,设置有静态缓存队列,所述静态缓存队列,存储对应热点文件的分块访问数据,以及在数据节点设置重定向消息,将数据的访问和地址变更能够及时反馈到用户端,实现了用户对数据节点信息的访问的快捷性。
-
公开(公告)号:CN114969018A
公开(公告)日:2022-08-30
申请号:CN202210913441.5
申请日:2022-08-01
Applicant: 太极计算机股份有限公司 , 中电科大数据研究院有限公司
IPC: G06F16/215 , G06F16/901 , G06F16/906 , G06N5/02
Abstract: 本发明实施例提供一种数据监控方法及系统,其中方法包括:确定待监控的当前数据治理平台的融合数据;将所述待监控的当前数据治理平台的融合数据输入至数据监控模型中,得到所述数据监控模型输出的数据监控结果;其中,所述数据监控模型是基于对当前数据治理平台的样本融合数据进行分类分级后生成知识图谱和质量知识库后得到的。本发明有效解决了目前数据治理平台存在的数据分类分级及质量管控工作中数据难以治理的问题。
-
公开(公告)号:CN119357177A
公开(公告)日:2025-01-24
申请号:CN202411920739.4
申请日:2024-12-25
Applicant: 中电科大数据研究院有限公司 , 中国电子科技集团公司第十五研究所
IPC: G06F16/215 , G06F18/2433 , G06F18/15 , G06N5/04
Abstract: 本申请公开了一种基于大模型的数据质量分析报告生成方法、系统、装置及存储介质,生成的质量报告具有深入分析和标准化建议,使得报告内容较为丰富,从而可满足复杂多变的业务需求。本申请方法包括:获取输入数据;对输入的数据进行缺失值、重复数据和异常值处理,以得到预处理数据;将所述预处理数据进行分类,以获取日志类型数据和原始数据;将目标知识库RAG集成于垂直大模型,并对所述垂直大模型进行微调,以获取垂直微调大模型;将所述日志类型数据和所述原始数据输入所述垂直微调大模型;获取所述垂直微调大模型生成的校验规则;在确定所述校验规则符合规则符合要求之后,根据所述校验规则生成高质量分析报告。
-
-
-
-
-
-
-
-
-