-
公开(公告)号:CN104850658A
公开(公告)日:2015-08-19
申请号:CN201510305681.7
申请日:2015-06-04
Applicant: 苏州大学张家港工业技术研究院
IPC: G06F17/30
CPC classification number: G06F17/30303 , G06F17/30595
Abstract: 本申请公开了一种数据填充方法,根据数据库中的已有数据确定所述数据库的空缺数据,并构建所述数据库中所有数据之间的数据依赖关系,重复执行以下步骤,直至所述数据库的空缺数据被填充完毕:根据所述数据库中的已有数据和所述数据依赖关系确定所述数据库的空缺数据中的可推断数据和至少一组不可推断数据,并根据预设规则从所述至少一组不可推断数据中确定一组待检索数据,根据所述数据库中的已有数据和所述数据依赖关系推断并填充所述可推断数据,从所述数据库的外部资源中检索并填充所述待检索数据。这样,通过推断和检索的交替执行,高效且高质量地实现数据集中空缺数据的填充,可以实现在较小的系统开销下获得较高的数据填充准确率。
-
公开(公告)号:CN104881487B
公开(公告)日:2018-08-17
申请号:CN201510304863.2
申请日:2015-06-04
Applicant: 苏州大学张家港工业技术研究院 , 苏州大学
Abstract: 本申请公开了一种基于质量控制的数据填充方法,根据数据库中的已有数据确定空缺数据,构建数据库的数据依赖关系并确定数据依赖关系的依赖可信度,根据已有数据和数据依赖关系确定空缺数据中的可推断数据和至少一组不可推断数据,并根据预设规则从至少一组不可推断数据中确定一组待检索数据,根据已有数据和数据依赖关系推断可推断数据并根据依赖可信度计算推断可信度,推断可信度大于预设阈值时填充可推断数据,从外部资源中检索待检索数据并根据依赖可信度计算检索可信度,检索可信度大于预设阈值时填充待检索数据。推断和检索交替执行能在较小的开销下保证较高的填充准确率,且考虑了数据依赖关系的依赖可信度能够使填充的数据的可信度较高。
-
公开(公告)号:CN104850658B
公开(公告)日:2018-08-17
申请号:CN201510305681.7
申请日:2015-06-04
Applicant: 苏州大学张家港工业技术研究院 , 苏州大学
IPC: G06F17/30
Abstract: 本申请公开了一种数据填充方法,根据数据库中的已有数据确定所述数据库的空缺数据,并构建所述数据库中所有数据之间的数据依赖关系,重复执行以下步骤,直至所述数据库的空缺数据被填充完毕:根据所述数据库中的已有数据和所述数据依赖关系确定所述数据库的空缺数据中的可推断数据和至少一组不可推断数据,并根据预设规则从所述至少一组不可推断数据中确定一组待检索数据,根据所述数据库中的已有数据和所述数据依赖关系推断并填充所述可推断数据,从所述数据库的外部资源中检索并填充所述待检索数据。这样,通过推断和检索的交替执行,高效且高质量地实现数据集中空缺数据的填充,可以实现在较小的系统开销下获得较高的数据填充准确率。
-
公开(公告)号:CN104991888A
公开(公告)日:2015-10-21
申请号:CN201510345955.5
申请日:2015-06-19
Applicant: 苏州大学张家港工业技术研究院
Abstract: 本发明公开了一种歧义消除方法,包括:获取预设数量个实例,从中获取正例,并确定与正例对应的反例,反例不属于上述实例;获取正例对应的正例文档及反例对应的反例文档的全部属性值;根据每个属性值在正例文档中的出现规律及该属性值在反例文档中的出现规律确定与预设数量个实例最为匹配的最优消歧属性值,利用最优消歧属性值更新正例文档和反例文档后,通过循环执行获取最优消歧属性值的步骤,获取全部最优消歧属性值,利用全部最优消歧属性值进行检索以获取实例中缺少的属性值,而不是仅仅利用实例中已提供的属性值进行检索,由此,能够有效消除检索所得结果的歧义性,更准确的获取预设数量个实例中所缺少的属性值。
-
公开(公告)号:CN104881487A
公开(公告)日:2015-09-02
申请号:CN201510304863.2
申请日:2015-06-04
Applicant: 苏州大学张家港工业技术研究院
CPC classification number: G06F17/30303 , G06F17/243 , G06F17/30522
Abstract: 本申请公开了一种基于质量控制的数据填充方法,根据数据库中的已有数据确定空缺数据,构建数据库的数据依赖关系并确定数据依赖关系的依赖可信度,根据已有数据和数据依赖关系确定空缺数据中的可推断数据和至少一组不可推断数据,并根据预设规则从至少一组不可推断数据中确定一组待检索数据,根据已有数据和数据依赖关系推断可推断数据并根据依赖可信度计算推断可信度,推断可信度大于预设阈值时填充可推断数据,从外部资源中检索待检索数据并根据依赖可信度计算检索可信度,检索可信度大于预设阈值时填充待检索数据。推断和检索交替执行能在较小的开销下保证较高的填充准确率,且考虑了数据依赖关系的依赖可信度能够使填充的数据的可信度较高。
-
-
-
-