一种基于关联可信度计算的数据筛选方法、系统和存储介质

    公开(公告)号:CN114297199A

    公开(公告)日:2022-04-08

    申请号:CN202111636366.4

    申请日:2021-12-29

    Abstract: 本发明公开了一种基于关联可信度计算的数据筛选方法,包括以下步骤:收集数据资源,生成原始数据汇总表;清洗原始数据汇总表,生成汇总数据表;设计汇总数据表中关联字段可信度的评估指标,计算关联字段在每个指标下的可信度得分;采用变异系数法,计算所述评估指标的指标系数;结合所述可信度得分和所述指标系数,计算关联字段的可信度;对关联字段的可信度进行抽样,与真实数据交叉验证,优化后生成可信度最高的落地数据表。在大数据处理体系中,本方案通过综合各类数据、进行特征选择,建立可信度评分模型,对获取的原始数据进行关联可信度打分,为数据分析、应用提供数据可信程度的支撑和参考,提升数据分析、应用的效果。

Patent Agency Ranking