基于大模型的民政数据血缘知识图谱的构造方法、装置

    公开(公告)号:CN120032724A

    公开(公告)日:2025-05-23

    申请号:CN202510522095.1

    申请日:2025-04-24

    Applicant: 北京大学

    Abstract: 本发明涉及数据管理与知识图谱领域,提供了一种基于大模型的民政数据血缘知识图谱的构造方法、装置,该方法包括:基于民政数据的元数据特征提取构建基础实体网络;基于基础实体网络,对数据表结构解析,生成数据表结构关系模型;解析复杂结构化查询语言语句,识别字段级血缘关联,生成初步的血缘关系图谱;然后遍历所有物理源表,消除虚拟表冗余和数据节点重复,生成优化后的血缘关系图谱;基于优化后的血缘关系图谱,识别公共数据节点并合并字段级数据血缘,生成最终的民政数据血缘关系图谱。本发明解决了现有技术中难以准确解析复杂SQL语句、处理虚拟表冗余和数据节点重复问题的问题,实现了高精度、自动化的民政数据血缘知识图谱构建。

Patent Agency Ranking