-
公开(公告)号:CN116701366A
公开(公告)日:2023-09-05
申请号:CN202310571804.6
申请日:2023-05-19
Applicant: 厦门市美亚柏科信息股份有限公司
IPC: G06F16/215
Abstract: 本发明提供一种基于数据要素的数据标记方法、数据处理方法及装置,方法包括:基于获取的业务信息,从预设描述维度创建包括要素标记字段的要素标记属性列表;根据资源表的信息,结合要素标记属性列表,进行要素标记,将资源ID与要素标记进行关联;依次标记资源表中不同的信息组;基于标记的信息组,找出信息组中的主体并进行标记;标记相同主体和相同要素标记的优先级。本发明的要素标记可以发挥数据元的作用,同时通过结合数据处理方法,易于刻画数据模型,便于形成数据资源或规则模型的数字化表达;突出资源关键特征,降低治理复杂度,加快治理进度;适于跨行业实施,释放数据价值。
-
公开(公告)号:CN116991842A
公开(公告)日:2023-11-03
申请号:CN202310641539.4
申请日:2023-06-01
Applicant: 厦门市美亚柏科信息股份有限公司
Abstract: 本发明公开了一种基于数据要素标签的数据分发方法、装置及可读介质,通过建立数据要素标签列表;在目标库中建立目标表,根据数据要素标签列表为目标表中的目标字段配置对应含义的数据要素标签,并配置目标表的分发策略信息,分发策略信息包括分发信息和分发规则,分发规则包括数据要素标签以及根据数据要素标签建立的逻辑关系;当来源库中的数据接入时,根据数据要素标签列表为来源库中的来源表中的来源字段配置对应含义的数据要素标签;根据分发策略信息建立来源表与目标表之间的第一映射关系以及来源字段与目标字段之间的第二映射关系,根据第一映射关系和第二映射关系将来源表中的数据分发至目标表中,可有效降低人工成本,提高分发效率。
-
公开(公告)号:CN114282591A
公开(公告)日:2022-04-05
申请号:CN202111369332.3
申请日:2021-11-18
Applicant: 厦门市美亚柏科信息股份有限公司
Abstract: 本发明涉及一种动态安全级别实时划分方法、终端设备及存储介质,该方法中包括:S1:设定数据资源的分类维度和每个分类维度下包含的类别,根据每个数据资源在不同分类维度下的类别,设定静态安全级别,根据静态安全级别,构建静态安全级别映射表;S2:初始化设定脱敏下界L、脱敏周期T、脱敏速率k(.)和脱敏模式M;S3:当接收到数据资源后,从静态安全级别映射表中查找对应的静态安全级别x;S4:判断该数据资源是否处于开放状态,如果是,设定该数据资源的动态安全级别y为脱敏下界L;否则,进入S5;S5:根据实时获得的该数据资源经过的脱敏期,计算实时动态安全级别:本发明引入数据开放控制与数据脱敏控制,实现数据资源安全级别的实时可控。
-
公开(公告)号:CN110196834A
公开(公告)日:2019-09-03
申请号:CN201910424014.9
申请日:2019-05-21
Applicant: 厦门市美亚柏科信息股份有限公司
Abstract: 本发明给出了一种用于数据项、文件、数据库的对标方法和系统,包括利用数据项与标准数据元进行完全匹配,直接获取与数据项对标的标准数据元;对无法完全匹配的数据项进行语义分析,选择语义相似度最高的标准数据元作为与数据项对标的标准数据元;对于语义分析无法匹配的数据项,基于数据项的数值特征规则将数据项的数值聚合为数据集,同时将标准数据元的数值聚合形成标准数据元数值特征库;利用余弦相似度算法对符合同一数值特征规则数据集和标准数据元数值特征库进行相似度分析,获得与数据集的数据项对标的标准数据元。通过多角度的分析比对,可以有效的提升数据项对标的速度和准确性。
-
公开(公告)号:CN119577306A
公开(公告)日:2025-03-07
申请号:CN202311125278.7
申请日:2023-09-01
Applicant: 厦门市美亚柏科信息股份有限公司
IPC: G06F17/16 , G06F16/9536 , G06Q50/00
Abstract: 本发明提出了一种基于已知个体间亲密度和关系贡献度的中心度计算方法及系统,包括:响应于将采集的社交网络数据转换为两个矩阵数据;两个所述矩阵数据包括个体间亲密度数据矩阵和关系贡献度数据矩阵,所述个体间亲密度数据矩阵的每一个元素代表特定两个个体之间的亲密度,关系贡献度数据矩阵的每一个元素代表个体间亲密度被其他个体贡献的程度;将度中心性、接近中心性和中介中心性的计算公式转化为基于已知个体间亲密度进行计算的公式。本发明的方案考虑了社交网络中已知的个体间亲密度,以及共同邻接节点对此亲密度的贡献程度,通过将复杂的图计算转化为简单的矩阵计算,实现更加高效、便捷的度中心度、接近中心度、中介中心度计算。
-
公开(公告)号:CN110196834B
公开(公告)日:2022-04-29
申请号:CN201910424014.9
申请日:2019-05-21
Applicant: 厦门市美亚柏科信息股份有限公司
Abstract: 本发明给出了一种用于数据项、文件、数据库的对标方法和系统,包括利用数据项与标准数据元进行完全匹配,直接获取与数据项对标的标准数据元;对无法完全匹配的数据项进行语义分析,选择语义相似度最高的标准数据元作为与数据项对标的标准数据元;对于语义分析无法匹配的数据项,基于数据项的数值特征规则将数据项的数值聚合为数据集,同时将标准数据元的数值聚合形成标准数据元数值特征库;利用余弦相似度算法对符合同一数值特征规则数据集和标准数据元数值特征库进行相似度分析,获得与数据集的数据项对标的标准数据元。通过多角度的分析比对,可以有效的提升数据项对标的速度和准确性。
-
公开(公告)号:CN114297236A
公开(公告)日:2022-04-08
申请号:CN202111449843.6
申请日:2021-11-30
Applicant: 厦门市美亚柏科信息股份有限公司
IPC: G06F16/2455 , G06F16/2458 , G06F21/60 , G06F16/22
Abstract: 本发明涉及一种数据血缘分析方法、终端设备及存储介质,该方法中包括:S1:提取数据的流转流程中经过的所有数据表,并基于数据表级别、数据项级别和数据行级别三个分析维度分别设定在各数据表中的唯一标识;S2:根据数据的流转流程中各数据的上下游唯一标识,构建表征数据流转流程的映射表;S3:根据待分析数据对应的分析维度,从映射表中查找待分析数据在该分析维度下对应的上下游唯一标识,基于提取的上下游唯一标识构建表征待分析数据在该分析维度下的数据流转流程的有向图。本发明实现了数据表、数据项、数据行三种维度的数据溯源,细化了数据溯源的颗粒度,能够追踪数据处理流程,为快速定位问题节点、查询变更数据点提供便利。
-
公开(公告)号:CN114282591B
公开(公告)日:2024-09-27
申请号:CN202111369332.3
申请日:2021-11-18
Applicant: 厦门市美亚柏科信息股份有限公司
IPC: G06F18/241 , G06F21/62
Abstract: 本发明涉及一种动态安全级别实时划分方法、终端设备及存储介质,该方法中包括:S1:设定数据资源的分类维度和每个分类维度下包含的类别,根据每个数据资源在不同分类维度下的类别,设定静态安全级别,根据静态安全级别,构建静态安全级别映射表;S2:初始化设定脱敏下界L、脱敏周期T、脱敏速率k(.)和脱敏模式M;S3:当接收到数据资源后,从静态安全级别映射表中查找对应的静态安全级别x;S4:判断该数据资源是否处于开放状态,如果是,设定该数据资源的动态安全级别y为脱敏下界L;否则,进入S5;S5:根据实时获得的该数据资源经过的脱敏期,计算实时动态安全级别:本发明引入数据开放控制与数据脱敏控制,实现数据资源安全级别的实时可控。
-
公开(公告)号:CN115908921A
公开(公告)日:2023-04-04
申请号:CN202211457173.7
申请日:2022-11-21
Applicant: 厦门市美亚柏科信息股份有限公司
IPC: G06V10/764 , G06V10/774 , G06N3/04 , G06N3/08
Abstract: 本申请提出了一种应对标签标注不完整的多标签分类的方法及装置,该方法包括以下步骤:S1、获取验证集和训练集,并且将验证集中的每张图片均人工标记上多个类别标签;以及S2、基于训练集和总损失函数训练多标签分类模型,其中,总损失函数包括正标签损失函数、负标签损失函数以及未标记标签损失函数;以及S3、基于验证集和再平衡参数计算获得未标记标签损失函数;以及S4、最终获得训练完成的多标签分类模型。本申请通过利用少部分标注完整的验证集来指导纠正大型多标签训练集中的标签标注不完整部分损失函数的计算,有效地节约了人工标记成本并提升了多标签分类任务的准确率。
-
-
-
-
-
-
-
-