-
公开(公告)号:CN114580403A
公开(公告)日:2022-06-03
申请号:CN202210140449.2
申请日:2022-02-16
Applicant: 中通服咨询设计研究院有限公司 , 江苏省通信服务有限公司
IPC: G06F40/289 , G06F40/126
Abstract: 本发明公开了一种企业管理数字化系统中重复主数据识别方法,包括以下步骤:步骤1,对企业管理数字化系统中的主数据初步无损去冗余压缩;步骤2,对步骤1中处理过的主数据进行分词,得到分词识别词汇,并计算词汇调整信息量;步骤3,对分词识别词汇进行编码;步骤4,计算主数据关键特征值;步骤5,识别疑似重复主数据;步骤6,完成企业管理数字化系统中重复主数据识别。本发明可识别传统的主数据识别方法无法识别的一些重复主数据,具有精度更高等,据此方法建立的重复主数据识别系统可以大大减少企业可能发生重复付款、重复备货等各种损失及因数据发现过晚,各种系统数据调整的运维工作量。