一种多源异构数据字典对齐的方法

    公开(公告)号:CN113836897A

    公开(公告)日:2021-12-24

    申请号:CN202111108385.X

    申请日:2021-09-22

    Abstract: 本发明涉及一种多源异构数据字典对齐的方法,属于大数据领域。本发明包括选择源数据库,选择源表,选择作为标准的源字段;选择目标数据库,选择目标表,选择需要对齐的目标字段;选择源表中的数据值;直接选择目数据表中的数据值或者通过算法智能筛选出目标表中的数据值,算法包括但不限于:余弦相似度匹配、编辑距离匹配、经纬度距离匹配、分类编码匹配、时间日期匹配;如果需要将目标表中的数据值扩充到源表中,开启扩充,将该数据值扩充到源表中;匹配成功查看匹配结果。本发明操作简单,匹配的结果也是一目了然,数据字典对齐后也让具体数据值的展现为统一的数据值。

Patent Agency Ranking