一种基于知识图谱的数据质量提升方法

    公开(公告)号:CN115905188A

    公开(公告)日:2023-04-04

    申请号:CN202211160479.6

    申请日:2022-09-22

    Applicant: 同济大学

    Abstract: 本发明公开了一种基于知识图谱的数据质量提升方法,包括,对数据库中的建表语句进行预处理,再进行实体抽取和关系抽取;提取数据库中的数据仓库加工流程之间的关系自动化建立知识图谱;基于知识图谱的关系检索,对数据处理和加工过程进行关联关系映射;在运用异常检测算法的过程中,利用知识图谱中的关联关系,为相近数据特征的异常检测提供数据补充,提升大数据的异常值检测效果。本发明简单利用了两种不同的异常检测算法模型对样板用电量数据进行检测,算法本身具有一定的局限性,在利用知识图谱进行群体划分对算法进行优化后,一定程度上提升了算法的精准度,通过知识图谱很好的反映出数据加工结构,有效地提高异常检测的精确度。

Patent Agency Ranking