针对数据资产的计算高效的有效标签确定

    公开(公告)号:CN112997172A

    公开(公告)日:2021-06-18

    申请号:CN201980072125.6

    申请日:2019-10-21

    Abstract: 本文描述的技术涉及确定数据资产的有效标签。例如,与数据资产相关联的每个标签可以与某些属性相关联。这样的属性的非限制性示例可以包括与应用标签的源相关联的置信水平、标签被应用于数据资产的应用日期、和/或应用标签的数据资产的分层深度、以及附加和/或备选类型的属性。当确定数据资产的标签的请求被接收时,应用于数据资产的所有标签的属性可以被检索和/或分析,以确定这样的标签中的哪一些标签对数据资产进行有效地分类。所确定的有效标签可以被返回到请求实体。

    使用数据流分析进行数据分类

    公开(公告)号:CN112602074B

    公开(公告)日:2024-07-26

    申请号:CN201980055926.1

    申请日:2019-06-25

    Abstract: 本文描述了一种用于利用数据流分析来执行关于源数据集和所生成的导出数据集的数据分类的系统和方法。根据所执行的动作和导出数据集,使用自适应算法来计算字段的流置信度。根据相关联的置信度和流置信度来计算针对特定标签的相关联的导出置信度。当相关联的导出置信度大于或等于第一阈值时,将特定标签复制到导出数据集。在一些实施例中,当相关联的导出置信度小于或等于第二阈值时,不将特定标签复制到导出数据集。否则,要采取的动作被标识。接收对该动作的响应,并且根据所接收的响应来修改自适应算法。

    多级数据沿袭视图
    3.
    发明授权

    公开(公告)号:CN113597605B

    公开(公告)日:2024-05-10

    申请号:CN202080022647.8

    申请日:2020-03-13

    Abstract: 本文所公开的多级数据沿袭视图系统允许生成较高级的数据沿袭视图。多级数据沿袭视图系统的实现方式使用各种计算机过程指令来实现,计算机过程指令包括:接收与多个对象有关的信息,其中对象中的至少一些对象被组织在分层结构中;确定这些对象中在分层结构的第一级处的至少一些对象之间的关系;以及基于在分层结构中的第一级处的对象之间的关系来推断在分层结构中的第二级处的对象之间的关系,其中在分层结构中的第一级处的对象之间的关系基于它们的组成部分的资产计数,第二级在分层结构中高于第一级。

    针对数据资产的计算高效的有效标签确定

    公开(公告)号:CN112997172B

    公开(公告)日:2024-08-06

    申请号:CN201980072125.6

    申请日:2019-10-21

    Abstract: 本文描述的技术涉及确定数据资产的有效标签。例如,与数据资产相关联的每个标签可以与某些属性相关联。这样的属性的非限制性示例可以包括与应用标签的源相关联的置信水平、标签被应用于数据资产的应用日期、和/或应用标签的数据资产的分层深度、以及附加和/或备选类型的属性。当确定数据资产的标签的请求被接收时,应用于数据资产的所有标签的属性可以被检索和/或分析,以确定这样的标签中的哪一些标签对数据资产进行有效地分类。所确定的有效标签可以被返回到请求实体。

    遵从性违反检测
    5.
    发明授权

    公开(公告)号:CN109479061B

    公开(公告)日:2021-12-10

    申请号:CN201780044956.3

    申请日:2017-07-13

    Abstract: 本公开的非限制性示例描述用于针对策略遵从性而扫描数据的系统和方法。在一个示例中,网络数据被评价以生成一个或多个分组。分组可以基于网络数据的文件类型。数据标识规则被应用以标识来自分组的文件数据的一种或多种数据架构。应用到数据架构的内容的一个或多个策略规则可以被确定。文件数据的至少一个文件可以被扫描以确定与一个或多个策略规则的遵从性。与一个或多个策略规则的遵从性的报告可以基于文件扫描的结果而生成。其他示例也被描述。

    使用数据流分析进行数据分类

    公开(公告)号:CN112602074A

    公开(公告)日:2021-04-02

    申请号:CN201980055926.1

    申请日:2019-06-25

    Abstract: 本文描述了一种用于利用数据流分析来执行关于源数据集和所生成的导出数据集的数据分类的系统和方法。根据所执行的动作和导出数据集,使用自适应算法来计算字段的流置信度。根据相关联的置信度和流置信度来计算针对特定标签的相关联的导出置信度。当相关联的导出置信度大于或等于第一阈值时,将特定标签复制到导出数据集。在一些实施例中,当相关联的导出置信度小于或等于第二阈值时,不将特定标签复制到导出数据集。否则,要采取的动作被标识。接收对该动作的响应,并且根据所接收的响应来修改自适应算法。

    遵从性违反检测
    7.
    发明公开

    公开(公告)号:CN109479061A

    公开(公告)日:2019-03-15

    申请号:CN201780044956.3

    申请日:2017-07-13

    Abstract: 本公开的非限制性示例描述用于针对策略遵从性而扫描数据的系统和方法。在一个示例中,网络数据被评价以生成一个或多个分组。分组可以基于网络数据的文件类型。数据标识规则被应用以标识来自分组的文件数据的一种或多种数据架构。应用到数据架构的内容的一个或多个策略规则可以被确定。文件数据的至少一个文件可以被扫描以确定与一个或多个策略规则的遵从性。与一个或多个策略规则的遵从性的报告可以基于文件扫描的结果而生成。其他示例也被描述。

    域不可知的资源分配框架

    公开(公告)号:CN104487947B

    公开(公告)日:2018-12-21

    申请号:CN201380038734.2

    申请日:2013-07-19

    Abstract: 本文中描述资源分配框架,其以域不可知的方式将项目(概念化为球)分配至项目接收槽(概念化为仓)。用户通过生成以声明性方式描述分配问题的规范来将资源分配框架实例化为特定分配问题。作为其它特征之一,该规范将真实实体映射成球和仓,并描述与分配问题相关联的约束。该规范还提供针对所提议的特定球至特定仓的指派计算资源消费的利用函数。根据另一方面,资源分配框架使用并行操作的许多处理元件(例如GPU线程、CPU线程等等)来尝试对分配问题求解。在此对解的搜索中,资源分配框架以探索模式和开拓模式的任何组合来操作。

    自动推断数据集的数据关系

    公开(公告)号:CN113508375B

    公开(公告)日:2025-04-01

    申请号:CN202080017936.9

    申请日:2020-02-20

    Abstract: 本文所描述的是用于推断多个数据集的数据关系的系统和方法。多个数据集的数据内容(以及可选的元数据)被扫描,以提取数据集中的每个数据集的特征。特征可以与数据的结构、数据集内的数据的简档和/或数据集的元数据有关。每个特征具有相关联的权重。基于已加权特征中的至少一些已加权特征(例如,基于数据集的sim‑散列或最小‑散列),数据集可以被聚类成簇。基于每个簇中的数据集的已加权特征,每个簇中的数据集之间的精确相似性度量被计算。具有高于阈值数量的精确相似性度量的数据集被推断为可能有关的。关于所推断的可能有关的数据集的信息被提供。

Patent Agency Ranking