一种面向不确定数据的概率查询质量优化方法

    公开(公告)号:CN106897375A

    公开(公告)日:2017-06-27

    申请号:CN201710039240.6

    申请日:2017-01-19

    Applicant: 浙江大学

    CPC classification number: G06F16/215 G06F16/217

    Abstract: 本发明公开了一种面向不确定数据的概率查询质量优化方法。给定有限资源,利用一个基于联合熵的质量函数度量查询质量,本方法能够确定需要清洗的不确定对象集合,使得在指定资源限制下达到期望查询质量最优的目的。本方法可分为两大部分:查询质量计算和清洗对象优选。在计算查询质量时,采用ASI索引所有可能的查询结果对象集,有效避免了质量计算过程中遍历所有可能世界,能够快速更新查询结果集的概率,从而提高质量计算效率。在选择清洗对象时,利用候选子集和质量函数单调性两个启发式规则,提出了一种精确的以及两种近似的清洗对象优选算法,在显著提高查询质量的同时,有效地减少了清洗对象优选时间,并保证清洗代价在给定的预算范围内。

    一种基于PostgreSQL和众包的不完整数据查询处理方法

    公开(公告)号:CN106897373B

    公开(公告)日:2020-01-21

    申请号:CN201710038856.1

    申请日:2017-01-19

    Applicant: 浙江大学

    Abstract: 本发明公开了一种基于PostgreSQL和众包的不完整数据查询处理方法,该方法利用众包(又名群智计算)技术,将人类解决问题的优势应用到本发明中,对不完整数据进行补全,进一步对于补全后的数据进行Skyline查询、Top‑k查询和区域查询,返回更加满足用户需求的查询结果。本方法先通过计算中心确定需要清洗的数据,并通过扩展SQL数据定义语言生成用户接口;然后通过HIT管理器向众包平台发布任务,进行数据补全;最后根据补全后的数据进行查询,得到查询结果。本发明基于PostgreSQL,为应用程序开发者提供了通用的查询接口,利用众包技术对数据进行补全,且查询效率、查询结果准确性明显好于现有的方法,提供了最佳性能。

    一种基于PostgreSQL和众包的不完整数据查询处理方法

    公开(公告)号:CN106897373A

    公开(公告)日:2017-06-27

    申请号:CN201710038856.1

    申请日:2017-01-19

    Applicant: 浙江大学

    Abstract: 本发明公开了一种基于PostgreSQL和众包的不完整数据查询处理方法,该方法利用众包(又名群智计算)技术,将人类解决问题的优势应用到本发明中,对不完整数据进行补全,进一步对于补全后的数据进行Skyline查询、Top‑k查询和区域查询,返回更加满足用户需求的查询结果。本方法先通过计算中心确定需要清洗的数据,并通过扩展SQL数据定义语言生成用户接口;然后通过HIT管理器向众包平台发布任务,进行数据补全;最后根据补全后的数据进行查询,得到查询结果。本发明基于PostgreSQL,为应用程序开发者提供了通用的查询接口,利用众包技术对数据进行补全,且查询效率、查询结果准确性明显好于现有的方法,提供了最佳性能。

Patent Agency Ranking