一种基于企业关联关系的工商高管人名消歧方法

    公开(公告)号:CN110020433B

    公开(公告)日:2023-04-18

    申请号:CN201910256769.2

    申请日:2019-04-01

    Abstract: 本发明公开了一种基于企业关联关系的工商高管人名消歧方法,涉及实体消歧领域,包括以下步骤:将待消歧数据集U,按高管姓名划分成组n个高管姓名组A;根据步骤S1得到的姓名组划分结果,对每个组A,构建N层以内的高管及企业关联关系网络G;针对每个姓名组A,根据密切度计算规则,计算姓名组A中高管节点之间的关联密切度f;根据关联密切度构建聚类函数CL,使用层次聚类算法得到消歧结果。本发明能自动化对工商高管人名进行消歧,具有较高的消歧准确率,且具有一定的阈值设置灵活性,可满足较多应用场景的工商高管人名消歧;同时可构建高管任职关联关系、高管投资关联关系,为高管全视角的关联图谱分析提供支撑。

    一种基于企业关联关系的工商高管人名消歧方法

    公开(公告)号:CN110020433A

    公开(公告)日:2019-07-16

    申请号:CN201910256769.2

    申请日:2019-04-01

    Abstract: 本发明公开了一种基于企业关联关系的工商高管人名消歧方法,涉及实体消歧领域,包括以下步骤:将待消歧数据集U,按高管姓名划分成组n个高管姓名组A;根据步骤S1得到的姓名组划分结果,对每个组A,构建N层以内的高管及企业关联关系网络G;针对每个姓名组A,根据密切度计算规则,计算姓名组A中高管节点之间的关联密切度f;根据关联密切度构建聚类函数CL,使用层次聚类算法得到消歧结果。本发明能自动化对工商高管人名进行消歧,具有较高的消歧准确率,且具有一定的阈值设置灵活性,可满足较多应用场景的工商高管人名消歧;同时可构建高管任职关联关系、高管投资关联关系,为高管全视角的关联图谱分析提供支撑。

    一种基于标准SQL的流式数据清洗转换方法和系统

    公开(公告)号:CN113760877A

    公开(公告)日:2021-12-07

    申请号:CN202110337239.8

    申请日:2021-03-10

    Abstract: 本发明公开了一种基于标准SQL的流式数据清洗转换方法和系统,根据本发明的一方面包括以下步骤:S1、系统初始化,针对系统库、工作线程、Groovy函数线程、SQL解析引擎进行初始化操作;S2、在上述初始化完成以后,系统开始进行数据清洗转换的工作。根据本发明的另一方面还包括系统初始化模块、内置算子库、SQL解析引擎、提交SQL模块、提交Groovy模块、Groovy类初始化模块、Groovy执行模块、数据重组模块、数据输入和输出模块。本发明的有益效果为:更加高效、便捷、灵活地对流式数据清洗、转换,筛选符合条件的数据,让数据对用户更加有价值。

    一种基于统一SQL的多源异构数据质量校验方法和系统

    公开(公告)号:CN113760681A

    公开(公告)日:2021-12-07

    申请号:CN202110260430.7

    申请日:2021-03-10

    Abstract: 本发明公开了一种基于统一SQL的多源异构数据质量校验方法和系统,根据本发明的一个方面包括以下步骤:S1、创建质量校验规则;S2、创建质量校验任务;S3、创建质量检验作业;S4、创建质量校验调度计划;S5、提交调度计划执行校验逻辑;S6、质量报告生成;根据本发明的另一个方面包括任务作业配置模块、作业调度模块、校验执行模块、数据质量报告生成与数据质量分析模块。本发明的有益效果为:可以对不同存储形式的数据进行直观、灵活、统一的质量管理,同时也能满足复杂的业务需求。

Patent Agency Ranking