一种基于质量控制的数据填充方法及系统

    公开(公告)号:CN104881487B

    公开(公告)日:2018-08-17

    申请号:CN201510304863.2

    申请日:2015-06-04

    Abstract: 本申请公开了一种基于质量控制的数据填充方法,根据数据库中的已有数据确定空缺数据,构建数据库的数据依赖关系并确定数据依赖关系的依赖可信度,根据已有数据和数据依赖关系确定空缺数据中的可推断数据和至少一组不可推断数据,并根据预设规则从至少一组不可推断数据中确定一组待检索数据,根据已有数据和数据依赖关系推断可推断数据并根据依赖可信度计算推断可信度,推断可信度大于预设阈值时填充可推断数据,从外部资源中检索待检索数据并根据依赖可信度计算检索可信度,检索可信度大于预设阈值时填充待检索数据。推断和检索交替执行能在较小的开销下保证较高的填充准确率,且考虑了数据依赖关系的依赖可信度能够使填充的数据的可信度较高。

    一种数据填充方法及系统

    公开(公告)号:CN104850658B

    公开(公告)日:2018-08-17

    申请号:CN201510305681.7

    申请日:2015-06-04

    Abstract: 本申请公开了一种数据填充方法,根据数据库中的已有数据确定所述数据库的空缺数据,并构建所述数据库中所有数据之间的数据依赖关系,重复执行以下步骤,直至所述数据库的空缺数据被填充完毕:根据所述数据库中的已有数据和所述数据依赖关系确定所述数据库的空缺数据中的可推断数据和至少一组不可推断数据,并根据预设规则从所述至少一组不可推断数据中确定一组待检索数据,根据所述数据库中的已有数据和所述数据依赖关系推断并填充所述可推断数据,从所述数据库的外部资源中检索并填充所述待检索数据。这样,通过推断和检索的交替执行,高效且高质量地实现数据集中空缺数据的填充,可以实现在较小的系统开销下获得较高的数据填充准确率。

    一种基于质量控制的数据填充方法及系统

    公开(公告)号:CN104881487A

    公开(公告)日:2015-09-02

    申请号:CN201510304863.2

    申请日:2015-06-04

    CPC classification number: G06F17/30303 G06F17/243 G06F17/30522

    Abstract: 本申请公开了一种基于质量控制的数据填充方法,根据数据库中的已有数据确定空缺数据,构建数据库的数据依赖关系并确定数据依赖关系的依赖可信度,根据已有数据和数据依赖关系确定空缺数据中的可推断数据和至少一组不可推断数据,并根据预设规则从至少一组不可推断数据中确定一组待检索数据,根据已有数据和数据依赖关系推断可推断数据并根据依赖可信度计算推断可信度,推断可信度大于预设阈值时填充可推断数据,从外部资源中检索待检索数据并根据依赖可信度计算检索可信度,检索可信度大于预设阈值时填充待检索数据。推断和检索交替执行能在较小的开销下保证较高的填充准确率,且考虑了数据依赖关系的依赖可信度能够使填充的数据的可信度较高。

    一种数据填充方法及系统

    公开(公告)号:CN104850658A

    公开(公告)日:2015-08-19

    申请号:CN201510305681.7

    申请日:2015-06-04

    CPC classification number: G06F17/30303 G06F17/30595

    Abstract: 本申请公开了一种数据填充方法,根据数据库中的已有数据确定所述数据库的空缺数据,并构建所述数据库中所有数据之间的数据依赖关系,重复执行以下步骤,直至所述数据库的空缺数据被填充完毕:根据所述数据库中的已有数据和所述数据依赖关系确定所述数据库的空缺数据中的可推断数据和至少一组不可推断数据,并根据预设规则从所述至少一组不可推断数据中确定一组待检索数据,根据所述数据库中的已有数据和所述数据依赖关系推断并填充所述可推断数据,从所述数据库的外部资源中检索并填充所述待检索数据。这样,通过推断和检索的交替执行,高效且高质量地实现数据集中空缺数据的填充,可以实现在较小的系统开销下获得较高的数据填充准确率。

Patent Agency Ranking