-
公开(公告)号:CN114428882A
公开(公告)日:2022-05-03
申请号:CN202111266934.6
申请日:2021-10-28
Applicant: 国际商业机器公司
IPC: G06F16/901
Abstract: 提供了执行以下操作的方法、计算机程序产品和/或系统:获得包括表示第一实体的第一节点和表示在第一实体之间的关系的第一边的第一图形,笫一节点与描述由第一节点表示的第一实体的第一实体属性相关联,第一边与描述由第一边表示的关系的第一边属性相关联;确定针对第一图形的第一节点中的特定节点的第一子图,第一子图包括特定节点和特定节点的至少一个相邻节点;以及至少部分地基于将数据质量规则集合中的一个或多个适用规则应用于第一子图的第一实体属性值和第一边属性值,来确定关于特定节点的数据质量问题。
-
公开(公告)号:CN106104533B
公开(公告)日:2019-10-18
申请号:CN201580013510.5
申请日:2015-02-18
Applicant: 国际商业机器公司
IPC: G06F16/35 , G06F16/907
Abstract: 本发明提供了一种用于处理用于存储至少非结构化数据的数据储存库(104)中的多个数据集(105;106;108;110‑113;DB1;DB2)的方法,该方法包括:‑提供(302)代理的集合(150‑168),每个代理可操作以触发数据集中的一个或多个数据集的处理,上述代理中的每个代理的执行在向上述代理指派的一个或多个条件满足的情况下自动触发,这些条件中的至少一个条件涉及其处理能够由上述代理来触发的数据集的存在、结构、内容和/或注释;‑执行(304)代理中的第一代理;‑由第一代理来更新(306)第一数据集的注释(115);以及‑执行(308)代理中的第二代理,上述执行由满足第二代理的条件的第一数据集的已更新注释来触发,从而触发第一数据集的注释的进一步更新。
-
公开(公告)号:CN115668174A
公开(公告)日:2023-01-31
申请号:CN202180035633.4
申请日:2021-04-16
Applicant: 国际商业机器公司
IPC: G06F16/35
Abstract: 一种计算机实现的方法用于对给定集合的数据元素进行排序。该方法包括执行对每个数据元素的第一类使用的评估。该方法包括根据对第一类使用的评估来确定数据元素候选集合。所述方法包括执行对数据元素候选集合中的每个数据元素的第二类使用的评估。该方法包括根据对数据元素候选集合的每个数据元素的第二类使用的评估来对数据元素候选集合的数据元素进行排序。该方法包括提供经排序的数据元素候选集合的数据元素,并且作为响应,接收基于所提供的经排序的数据元素候选集合的数据元素的数据处理请求。
-
公开(公告)号:CN103631842B
公开(公告)日:2016-12-28
申请号:CN201310362102.3
申请日:2013-08-19
Applicant: 国际商业机器公司
IPC: G06F17/30
CPC classification number: G06F17/30979 , G06F17/30336
Abstract: 本发明涉及用于检测多列复合键列集合的方法和系统。提供了检测一个或多个多列复合键列集合的计算机实现的方法,包括:a)访问(102)多个第一列(P1-P3);b)选择(104)第一列中的两个或更多个用作候选列的当前集合(218);c)通过将与候选列的参数值相关联地存储的对象标识符彼此进行比较,确定(106)针对候选列的当前集合是否存在参数值的至少一个元组(219),其参数值分别与对象标识符中的两个或更多个共享对象标识符相关联地存储;d1)在不存在该至少一个元组的情况下,将当前候选列集合标识110)为多列复合键列集合;d2)否则通过第一列中另外选择的一个来替换(112)第二候选列,或将第一列中该所述另外选择的一个添加到候选列集合中。
-
公开(公告)号:CN103080924A
公开(公告)日:2013-05-01
申请号:CN201180042917.2
申请日:2011-07-14
Applicant: 国际商业机器公司
CPC classification number: G06F17/10 , G06F17/30569 , G06F17/30598
Abstract: 公开一种用于处理数据集(12,14)的改进方法。该方法包括步骤:提供与第一数据集(12)关联的第一特性(20.1)以及以下的至少一个:单个数据值(12’)和与第二数据集(14)关联的第二特性(20.2);提供的特性允许第一数据集(12)、第二数据集(14)和单个数据值(12’)的可行比较,以及计算以下的至少一个:基于第一和第二特性(20.1,20.2)的第一数据集(12)与第二数据集(14)的相似性,基于第一特性(20.1)和单个数据值(12’)的第一数据集(12)与单个数据值(12’)的相似性,基于第一特性的指示第一特性在多大程度上反映第一数据集(12)的属性的置信度,以及基于第一特性和单个数据值(12’)的指示第一数据集与单个数据值(12’)的相似性在多大程度上反映单个数据值的属性的置信度。
-
公开(公告)号:CN1920825A
公开(公告)日:2007-02-28
申请号:CN200610093552.7
申请日:2006-06-26
Applicant: 国际商业机器公司
IPC: G06F17/30
CPC classification number: G06Q10/06
Abstract: 对流建模由于涉及许多元件以及异构型环境越来越普及而变得越来越复杂。根据现有技术,对流建模分两个阶段执行。在设计阶段,用户使用流设计工具将流的元件设置在图形用户界面上,以便得到的流满足用户的需求。在第二阶段即仿真阶段中,仿真流的性能,并根据仿真结果,用户改变流的设计以便提高流的性能。在此公开中给出了一种方法和系统,其通过考虑元件之间的交互来确定流的元件的性能值,并在设计阶段期间在图形用户界面上可视化这些性能值。因此,流的元件之间的交互对于用户变为透明的,并且可立即识别瓶颈。
-
公开(公告)号:CN103080924B
公开(公告)日:2016-09-07
申请号:CN201180042917.2
申请日:2011-07-14
Applicant: 国际商业机器公司
CPC classification number: G06F17/10 , G06F17/30569 , G06F17/30598
Abstract: 公开一种用于处理数据集(12,14)的改进方法。该方法包括步骤:提供与第一数据集(12)关联的第一特性(20.1)以及以下的至少一个:单个数据值(12’)和与第二数据集(14)关联的第二特性(20.2);提供的特性允许第一数据集(12)、第二数据集(14)和单个数据值(12’)的可行比较,以及计算以下的至少一个:基于第一和第二特性(20.1,20.2)的第一数据集(12)与第二数据集(14)的相似性,基于第一特性(20.1)和单个数据值(12’)的第一数据集(12)与单个数据值(12’)的相似性,基于第一特性的指示第一特性在多大程度上反映第一数据集(12)的属性的置信度,以及基于第一特性和单个数据值(12’)的指示第一数据集与单个数据值(12’)的相似性在多大程度上反映单个数据值的属性的置信度。
-
公开(公告)号:CN100428238C
公开(公告)日:2008-10-22
申请号:CN200610093552.7
申请日:2006-06-26
Applicant: 国际商业机器公司
IPC: G06F17/30
CPC classification number: G06Q10/06
Abstract: 对流建模由于涉及许多元件以及异构型环境越来越普及而变得越来越复杂。根据现有技术,对流建模分两个阶段执行。在设计阶段,用户使用流设计工具将流的元件设置在图形用户界面上,以便得到的流满足用户的需求。在第二阶段即仿真阶段中,仿真流的性能,并根据仿真结果,用户改变流的设计以便提高流的性能。在此公开中给出了一种方法和系统,其通过考虑元件之间的交互来确定流的元件的性能值,并在设计阶段期间在图形用户界面上可视化这些性能值。因此,流的元件之间的交互对于用户变为透明的,并且可立即识别瓶颈。
-
公开(公告)号:CN116888584A
公开(公告)日:2023-10-13
申请号:CN202280016349.7
申请日:2022-02-18
Applicant: 国际商业机器公司
IPC: G06F16/215
Abstract: 描述了涉及云计算环境的管理服务域中的自动数据标准化的技术。一种相关联的计算机实现的方法,包括在数据载入过程期间接收数据集,以及对数据集内的数据点进行分类。该方法还包括将机器学习数据标准化模型应用于数据集内的每个分类的数据点,以及基于因模型应用而确定的任何标准化修改得到针对数据集的所提出的数据标准化规则集。可选地,该方法包括呈现所提出的数据标准化规则集用于客户端审阅,以及响应于接受所提出的数据标准化规则集,将所提出的数据标准化规则集应用于数据集。该方法进一步包括:响应于接受所提出的数据标准化规则集,相应地更新机器学习数据标准化模型。
-
公开(公告)号:CN116194922A
公开(公告)日:2023-05-30
申请号:CN202180065641.3
申请日:2021-09-21
Applicant: 国际商业机器公司
IPC: G06F21/62
Abstract: 在一种方法中,处理器接收对文档的请求(201)。处理器识别包括敏感数据集的数据集的集合(203),数据集的集合根据关系模型相互关联。处理器提取文档的属性值(205)。处理器确定所提取的属性值中的一个或多个属性值的集合在该数据集的集合中(207),该属性值的集合是属性集合的值。处理器确定可基于属性集合之间的关系模型的关系来识别该敏感数据集的一个或多个实体(209),其中一个或多个实体的属性值的至少部分包括敏感信息。处理器响应于确定可识别一个或多个实体,掩蔽文档中的一个或多个属性值的集合的至少一部分(211)。
-
-
-
-
-
-
-
-
-