多源数据字典融合方法及装置、介质、设备

    公开(公告)号:CN117421421A

    公开(公告)日:2024-01-19

    申请号:CN202311345875.0

    申请日:2023-10-16

    Applicant: 东北大学

    Inventor: 杨万哲 王庆 王历

    Abstract: 本申请公开了一种多源数据字典融合方法。方法包括:获取待融合数据字典及数据逻辑描述信息;基于数据逻辑描述信息在待融合数据字典的数据字典表中提取第一关键词;基于数据字典表中字段的词频在数据字典表中提取第二关键词,并融合第一关键词及第二关键词得到目标关键词;计算目标关键词的二维加权编辑距离,对数据字典表进行初次分类得到数据字典表的粗类别;在同一粗类别中,计算字段的多维加权编辑距离,对数据字典表进行再次分类得到数据字典表的细类别;在同一细类别中,计算数据字典表的表格相似度,并根据表格相似度融合数据字典表。本申请解决了依赖设计人员对数据字典的设计文档进行修改的方案中存在的人员成本高、周期长等问题。

Patent Agency Ranking