测量图形数据库中的数据的数据质量

    公开(公告)号:CN114428882A

    公开(公告)日:2022-05-03

    申请号:CN202111266934.6

    申请日:2021-10-28

    Abstract: 提供了执行以下操作的方法、计算机程序产品和/或系统:获得包括表示第一实体的第一节点和表示在第一实体之间的关系的第一边的第一图形,笫一节点与描述由第一节点表示的第一实体的第一实体属性相关联,第一边与描述由第一边表示的关系的第一边属性相关联;确定针对第一图形的第一节点中的特定节点的第一子图,第一子图包括特定节点和特定节点的至少一个相邻节点;以及至少部分地基于将数据质量规则集合中的一个或多个适用规则应用于第一子图的第一实体属性值和第一边属性值,来确定关于特定节点的数据质量问题。

    数据集成背景中的标准化
    2.
    发明公开

    公开(公告)号:CN116888584A

    公开(公告)日:2023-10-13

    申请号:CN202280016349.7

    申请日:2022-02-18

    Abstract: 描述了涉及云计算环境的管理服务域中的自动数据标准化的技术。一种相关联的计算机实现的方法,包括在数据载入过程期间接收数据集,以及对数据集内的数据点进行分类。该方法还包括将机器学习数据标准化模型应用于数据集内的每个分类的数据点,以及基于因模型应用而确定的任何标准化修改得到针对数据集的所提出的数据标准化规则集。可选地,该方法包括呈现所提出的数据标准化规则集用于客户端审阅,以及响应于接受所提出的数据标准化规则集,将所提出的数据标准化规则集应用于数据集。该方法进一步包括:响应于接受所提出的数据标准化规则集,相应地更新机器学习数据标准化模型。

Patent Agency Ranking