-
公开(公告)号:CN115769195A
公开(公告)日:2023-03-07
申请号:CN202180035421.6
申请日:2021-03-12
Applicant: 微软技术许可有限责任公司
Inventor: S·P·达什 , A·C·柯尼格 , K·马哈帕特拉 , D·H·彭 , Y·E·帕克 , 杨驰 , M·S·苏布兰马尼安 , C·A·加林多-勒加里亚
IPC: G06F16/2453
Abstract: 用于在利用数据流草图和样本的框架中进行分布式直方图计算的方法由系统和设备来执行。大型数据集的分布在无需排序的情况下由计算池进行一次扫描并处理,以生成每个分布的局部草图和值样本。局部草图和样本被利用来构造局部直方图,在该直方图上获得用于生成针对分布的分布式查询的查询计划的基数估计。分布的局部统计也被合并和整合,以构造表示整个数据集的全局直方图。全局直方图被利用来确定用于生成针对整个数据集的输入查询的查询计划的基数估计。向数据集或分布添加新的数据涉及对新的数据的扫描,从中生成新的统计,然后将其与现有统计数据合并以获得新的全局直方图。