-
公开(公告)号:CN116467403A
公开(公告)日:2023-07-21
申请号:CN202310656992.2
申请日:2023-06-05
Applicant: 北京华宇信息技术有限公司
IPC: G06F16/31 , G06F16/215 , G06F16/22 , G06F16/25 , G06F16/27 , G06F40/216 , G06F40/284 , G06F40/295 , G06F18/22 , G06F16/35 , G06F9/54 , G06N3/0442 , G06N3/045 , G06N3/0455 , G06Q30/018 , G06Q50/26
Abstract: 本申请公开了一种企业身份信息数据融合方法及装置,用以解决数据治理能力差的技术问题。其中,一种数据融合方案,包括:采集企业对象的身份信息数据,并构成原始数据集合;对若干身份信息数据进行预处理,更新为整合数据集合;根据预设识别策略,确定整合数据集合中的唯一标识属性,作为融合键;建立整合数据集合中任意元素与融合键的关联关系,更新为融合数据集合;分别输入至命名实体识别模型、事件抽取模型、文本相似度计算模型、关键词提取模型,得到第一、第二、第三、第四信息分析数据,并以预设存储格式策略存储,作为企业对象在当前周期内的身份信息数据。这样将来自不同数据库的数据规范化,统一治理,提高了企业合规改进效率。